Przepływność bitowa cyfrowego sygnału audio
W czasach analogowego sprzętu hi-fi przepływność bitowa była w zasadzie terminem z dziedziny telekomunikacji i informatyki, niezwiązanym z techniką audio. Pierwsze eksperymentalne czy profesjonalne urządzenia z cyfrowym zapisem dźwięku niewiele zmieniły w tej materii, bo zajmowali się nimi nieliczni specjaliści i hobbyści. Po debiucie płyt CD zapis cyfrowy się upowszechnił, a przepływność bitowa sygnału audio stała się terminem używanym znacznie częściej. Jednak największa zmiana nastąpiła pod wpływem popularyzacja plików audio - przepływność bitowa zaczęła budzić dużo większe zainteresowanie w branży hi-fi. Poniżej wyjaśnimy co oznacza sam termin, jak należy przepływność interpretować, jakie nieścisłości można spotkać i przedstawimy też tabelę z zestawieniem przepływności najczęściej spotykanych w praktyce na rynku hi-fi.
Podstawowe informacje o przepływności
Przepływność to cecha sygnału cyfrowego (ang. bit rate lub bitrate) i oznacza ona ilość bitów przesyłanych w jednostce czasu. Najczęściej podaje się ilość bitów na sekundę, inne przedziały czasu nie są stosowane. Przypomnijmy, że bit to najmniejsza jednostka informacji, a więc przepływność wyraża ilość informacji przekazywaną w sygnale cyfrowym w ciągu jednej sekundy. Wyższa przepływność bitowa w praktyce oznacza możliwość osiągnięcia wyższej jakości zapisu sygnału audio. Różnice jakości są tym łatwiej słyszalne im mniejsze są porównywane przepływności.
Są też inne jednostki, jak choćby bajty na sekundę, ale w praktyce nie stosuje się ich do opisu cyfrowych sygnałów audio. Czasami można napotkać nieścisłości czy błędy w sposobie zapisu co prawdzi do mylenia bitów z bajtami oraz mylenia mnożników dziesiętnych z mnożnikami binarnymi. Akurat w audio te problemy mają bardzo małe znaczenie. Poza audio występują nieraz wątpliwości czy przedrostek kilo oznacza mnożnik dziesiętny równy 1000 (103) czy też mnożnik binarny rowny 1024 (210). W technice audio i wideo przyjęło się jednak stosowanie mnożnika dziesiętnego (k=1000, M=1000000). A więc spotkamy następujące jednostki:
1kbs=1000bs (tysiąc bitów na sekundę)
1Mbs=1000000bs (milion bitów na sekundę)
1Gbs=1000000000bs (miliard bitów na sekundę)
Zamiennie stosuje się kilka konwencji zapisu skrótu oznaczającego ilość bitów na sekundę. Zarówno kbps, kbs, kbit/s jak i kb/s oznacza kilobity na sekundę. Analogicznie wygląda sytuacja dla megabitów czy gigabitów.
Jeśli w specyfikacji przepływności bitowej sygnału audio zamiast małego b pojawi się wielkie B (oznaczające bajty a nie bity) to najprawdopodobniej mamy tylko do czynienia z pomyłką i w dalszym chodzi o bity, a nie o bajty. Poza tym jest jeszcze jedna okoliczność, która powoduje, że w audio mamy bardzo małe ryzyko nieporozumień dotyczących przepływności bitowej. Zestaw stosowanych ilości kanałów, częstotliwości próbkowania, poziomów kwantyzacji i systemów kompresji jest ograniczony, tak więc można łatwo sprawdzić jaka jest przepływność bitowa danego rodzaju sygnału, nawet jeśli do jakiejś specyfikacji wkradł się błąd. W zamieszczonej poniżej tabeli znajdą Państwo zestawienie przepływności najważniejszych typów sygnałów, co w razie potrzeby ułatwi sprawdzenie poprawności danych, które Państwo napotkacie.
Natomiast wielkości plików przyjęło się określać w bajtach, gdzie 1bajt=8bitów. Oprócz tego bajty są zapisywane zarówno w notacji dwójkowej (k=1024, M=1048576) jak i w notacji dziesiętnej SI (k=1000, M=1000000) i często ignorowane jest zalecenie IEC aby w notacji binarnej stosować przedrostki Ki, Mi zamiast k, M. Tak więc kiedy będziemy próbowali obliczać wielkość pliku na podstawie przepływności i czasu nagrania (lub wykonać obliczenie odwrotne) to trzeba zwrócić uwagę na sposób zapisu wielkości pliku i pamiętać też o przeliczaniu bitów na bajty.
Przepływność netto i brutto
W cyfrowej technice audio zazwyczaj jest tak, że oprócz czystej informacji o wartości sygnału dźwiękowego zapisywane są też informacje dodatkowe. Są one przede wszystkim związane z technikami kodowania sygnału, korekcją błędów czy zaszywaniem dodatkowych danych takich jak choćby tytuły. W praktyce przyjęło się, że określając przepływność sygnału audio pomijamy te dodatki i podajemy wartość netto. Stąd wielkość pliku z zapisem dźwiękowym z reguły będzie większa niż to wynika z samej tylko przepływności bitowej, a ta sama informacja audio zapisana na różne sposoby będzie nieraz zajmować różną ilość miejsca na nośniku, nawet jeśli stosujemy zapis bez kompresji.
Kompresja stratna i bezstratna
Kiedy względy natury technicznej i/lub ekonomicznej wymuszają minimalizację przepływności bitowej sygnału trzeba stosować odpowiednie rozwiązania. Do pewnego stopnia można ograniczać częstotliwość próbkowania i rozdzielczość bitową sygnału (czyli zmniejszyć zakres dynamiki sygnału), ale kluczowe znaczenia ma wykorzystanie kompresji.
Kompresja bezstratna pozwala na zachowanie pełnej oryginalnej informacji bez jakichkolwiek strat. Z punktu widzenia zwykłego użytkownika bezstratna kompresja to praktycznie darmowa korzyść. Wadą bezstratnej kompresji jest konieczność wykonania dodatkowych operacji związanych z kodowaniem i dekodowaniem, ale w obecnych realiach technicznych jest to znikomy, niemal pomijalny koszt. Kompresja bezstratna w audio ma jednak ograniczoną skuteczność. Skompresowany bezstratnie sygnał ma zwykle przepływność bitową około 50-60% oryginału, niezależnie od wybranego kodeka. W praktyce jest to maksymalna kompresja bezstratna jaką daje się uzyskać dla sygnałów audio. Uzyskanie wyższego wpółczynnika kompresji wymaga zastosowania kompresji stratnej powodującej zawsze jakieś pogorszenie jakości. Im silniejsza będzie kompresja stratna tym bardziej ucierpi jakość. Przy czym w przypadku kompresji stratnej sam wybór kodeka ma już istotne znaczenie. Generalnie nowsze kodeki są lepsze niż kodeki starsze. Nie ma możliwości aby precyzyjnie porównać jakość różnych kodeków bezstratnych, ale w bardzo zgrubnym przybliżeniu można przyjąć, że starsze kodeki potrzebują kilkadziesiąt procent większej przepływności bitowej aby zapewnić taką samą jakość jak kodeki nowoczesne.
CBR i VBR - stała i zmienna przepływność
We wszystkich typowych systemach użytkowanych w praktyce cyfrowy sygnał audio bez kompresji ma zawsze stałą przepływność bitową. W przypadku sygnałów skompresowanych tak być nie musi. Zależnie od tego jaki rodzaj kompresji zostanie zastosowany przepływność może być stała lub zmienna. Stąd spotykane są skróty CBR (constant bit rate - stała przepływność bitowa) oraz VBR (variable bit rate - zmienna przepływność bitowa). Biorąc pod uwagę bardzo dużą zmienność sygnału audio nietrudno zgadnąć, że korzystniejsza dla jakości skompresowanego zapisu jest zmienna przepływność bitowa. Zmienny jest przecież sam sygnał audio i zmienna w czasie jest ilość informacji, którą trzeba kompresować. Z drugiej jednak strony dla uproszczenia przetwarzania sygnału oraz dla dopasowania się do przepustowości kanału transmisyjnego korzystniejsza jest nieraz stała przepływność bitowa. W praktyce stosuje się obydwa warianty. Przykładowo MP3 występuje zarówno w wersji CBR jak i VBR, a OggVorbis bazuje na kompresji VBR. W typowych zastosowaniach korzystniejsze dla użytkowników sprzętu audio jest wykorzystanie kompresji VBR.
Interpretacja i znaczenie przepływności w audio
Jak już wspomnieliśmy przepływność bitowa w dużej mierze określa możliwy do osiągnięcia maksymalny pułap jakości. Związek między jakością a przepływnością nie jest jednak bezpośredni, bo trzeba uwzględnić kilka dodatkowych czynników. Po pierwsze trzeba wziąć pod uwagę czy zastosowano kompresję i jakiego rodzaju jest to kompresja. Jak już wspomnieliśmy kompresja bezstratna to prosty sposób na poprawę efektywności wykorzystania dostępnej przepływności bitowej, a różnice efektywności poszczególnych kodeków bezstratnych są praktycznie pomijalne w interesującym nas tu kontekście. Natomiast w przypadku kompresji stratnej sytuacja jest już inna i jakość kodeka ma znaczenie.
Nawet jeśli ograniczymy się do sygnałów bez jakiejklowiek kompresji to też trzeba zachować pewną ostrożność przy ocenie związku jakości z przepływnością bitową. Trudno bezpośrednio porównać jakość sygnałów kodowanych różnymi sposobami, co w szczególności dotyczy porównania DSD (zapis 1-bitowy) i PCM (zapis wielobitowy), a sygnał wykorzystujący kodowanie MQA jest pod tym względem jeszcze bardziej odmienny. Trzeba też pamiętać, że dostępne są takie techniki jak dither czy kształtowanie szumu - wpływają one na charakter oraz rozkład szumów i zniekształceń, a przy tym nie zmieniają przepływności bitowej. Wpływ na sygnał audio ma też sposób filtrowania przy konwersji analogowo-cyfrowej i konwersji cyfrowo-analogowej. Dodatkową komplikacją jest zróżnicowanie ilości kanałów stosowanych do rejestracji dźwięku, nie zawsze możemy ograniczyć się do analizy dwukanałowgo stereo. Różne są też opinie co do tego jaka przepływność jest nam potrzebna. Według niektórych badaczy podnoszenie przepływności powyżej poziomu CD nie przynosi słyszalnych korzyści, ale jest też wiele osób, które dostrzegają słyszalne zalety wyższych przepływności. Niezależnie od oceny korzyści odbieranych subiektywnie przy odsłuchu, nadwyżka przepływności ma też zalety natury czysto technicznej. W grę wchodzi zwłaszcza złagodzenie skutków ubocznych filtracji, a także lepsze jakościowo przetwarzanie sygnału, nawet jeśli chodzi o tak prostą operację jak cyfrowa regulacja głośności. Następna uwaga to oczywiście banał, ale jednak i o tym trzeba przypomnieć. Nawet najwyższa przepływność bitowa nie zrekompensuje strat wniesionych przez gorsze mikrofony, gorszą obróbkę sygnału w studio nagraniowym, gorszy miks czy gorszy mastering.
Przepływność z płyty CD jako punkt odniesienia
Zwyczajowo przyjęło się, że przepływność stosowana na płycie CD jest punktem odniesienia dla wszystkich innych sygnałów audio. Wyróżnienie płyty CD jest czysto umowne, ale takie podejście ma jednak racjonalne podstawy. Płyta CD była pierwszym powszechnie stosowanym cyfrowym nośnikiem sygnału audio, a więc mamy tu uzasadnienie historyczne. Jeszcze ważniejszy jest aspekt techniczny. Parametry CD zostały dobrane z myślą o zapewnieniu wysokiej jakości dźwięku. Przyjęta częstotliwość próbkowania i rozdzielczość daje teoretycznie możliwość zapisu całego zakresu pasma akustycznego i przekazu całego zakresu dynamiki sygnałów spotykanych w muzyce. Wbrew reklamom z czasów inauguracji CD te parametry nie zapewniają idealnego dźwięku, a poza tym są zdecydowanie zbyt skromne na potrzeby obróbki dźwięku w studiach nagraniowych.
Na płycie CD mamy dwa kanały po 44.100 próbek na sekundę, każda próbka po 16 bitów.
2 * 44,100 * 16 = 1.411.200 bps
Obiegowo podaje się zwykle zaokrągloną liczbę. W wersji bardziej zgrubnej jest to 1,4 Mbs, a w wersji dokałdniejszej 1,411Mbs.
Przepływności bitowe typowych sygnałów audio | ||||||
Sygnał | Kompresja | Kanały | Próbkowanie | Rozdzielczość | Przepływność | Krotność CD |
typowa transmisja telefoniczna | stratna | 1 | typowo 8 kHz | - | 6 do 12 kbs | 0,004-0,009 |
typowe transmisje DAB, DAB+ | stratna MP2 lub AAC+ | 1 lub 2 | do 48 kHz | 16 bitów | 64 do 192 kbs | 0,045-0,136 |
MP3 (maksymalna przepływność 320 kbit/s) | stratna | 2 | do 48 kHz | 16 bitów | 320 kbs | 0,227 |
FLAC (z rozdzielczością CD) | bezstratna | 2 | 44,1 kHz | 16 bitów | 700-840 kbs (typowo) | 0,5-0,6 (typowo) |
płyta CD | brak | 2 | 44,1 kHz | 16 bitów | 1,4112 Mbs | 1 |
kaseta DAT (wariant maksymalny) | brak | 2 | 48 kHz | 16 bitów | 1,536 Mbs | 1,089 |
płyta DVD-Video z audio PCM 96/24 | brak | 2 | 96 kHz | 24 bity | 4,608 Mbs | 3,27 |
DSD64 (jak na SACD) | brak | 2 | 2,8224 MHz | 1 bit | 5,6448 Mbs | 4 |
DSD64 (krotność 48kHz) | brak | 2 | 3,072 MHz | 1 bit | 6,144 Mbs | 4,35 |
Plik stereo 192/24 | brak | 2 | 192 kHz | 24 bity | do 9,216 Mbs | 6,53 |
DVD-Audio | bezstratna MLP | 1 do 5.1 | do 192 kHz | do 24 bitów | do 9,6 Mbs | 6,8 (maks.) |
DSD128 (krotność 44,1kHz) | brak | 2 | 5,6448 MHz | 1 bit | 11,2896 Mbs | 8 |
DSD128 (krotność 48kHz) | brak | 2 | 6,144 MHz | 1 bit | 12,288 Mbs | 8,71 |
DXD (stereo) | brak | 2 | 352,8 kHz | 24 bity | 16,9344 Mbs | 12 |
Dolby TrueHD | bezstratna MLP | do 14 | do 192 kHz | do 24 bitow | do 18,0 Mbs | 12,76 (maks.) |
DSD256 (krotność 44,1kHz) | brak | 2 | 11,2896 MHz | 1 bit | 22,5792 Mbs | 16 |
DSD256 (krotność 48kHz) | brak | 2 | 12,288 MHz | 1 bit | 24,576 Mbs | 17,41 |
DSD512 (krotność 44,1kHz) | brak | 2 | 22,5792 MHz | 1 bit | 45,1584 Mbs | 32 |
DSD512 (krotność 48kHz) | brak | 2 | 24,576 MHz | 1 bit | 49,152 Mbs | 34,83 |