Co je MP3? |
Historie instantního zvuku
V roce 1987 začal Fraunhoferův institut integrovaných obvodů spolu s Dieterem
Seitzerem (profesor Erlangenské univerzity) pracovat na novém formátu pro
digitální zpracování zvuku. Tento formát měl umožnit efektivní kompresi
digitálních zvukových záznamů s minimální ztrátou kvality. Klíč měl být
nalezen v nedokonalosti lidského sluchu. Byl navržen mocný algoritmus, který
je od roku 1989 znám jako MPEG Audio Layer-3 neboli MP3. Motion Pictures
Experts Group (MPEG) dohlíží na standardy audiovizuálních datových formátů na
Internetu. MP3 je součástí standardu audiovizuálního formátu MPEG-1.
Co to je
MP3?
MP3 je formát zápisu zvukového signálu. Soubory MP3 jsou řádově veliké několik
megabytů (MB). Jejich velikost je závislá na délce záznamu a na šíři datového
toku (bitrate). Bitrate udává počet bitů, pomocí kterých je zapsána jedna
vteřina záznamu. Čím větší bitrate, tím lepší kvalita, ale menší komprese a
větší soubor. Dnes se nejvíce používá bitrate v rozmezí 128 až 192 kbps (kilo
bit per second). Od 160 kbps je záznam téměř nerozeznatelný od originálu. Proč
ale vlastně komprimovat?
Je rozdíl použít CD-ROM pro jedno album nebo pro
třináct
Nekomprimované formáty (jako např. běžné zvukové CD) jsou pro zpracování
počítačem nepraktické, neboť každá minuta záznamu v CD kvalitě zabírá přibližně
10 MB (megabytů). Album potom dosahuje průměrně velikosti 400 MB. To je i při
velikostech dnešních pevných disků (desítky GB; 1 GB = 1000 MB) a CD-ROM (650
MB) příliš. Převodem do formátu MP3 lze tuto velikost zmenšit (s minimálními
ztrátami kvality) přibližně desetkrát. Jedna minuta signálu tak odpovídá zhruba
1 MB (při bitrate 128 kbps). Čtyřminutovou píseň lze uložit do souboru o
velikosti kolem 5 MB. Čtyřicetiminutové album MP3 zabere asi 50 MB. Na průměrný
disk o velikosti 20 GB se vejde asi tak 400 alb. Na běžný CD-ROM potom třináct.
MP3 není
žádné kouzlo, pouhé využití nedokonalosti
Algoritmus kódování MP3 je tak účinný díky několika základním postupům. MP3
prošlo za dobu své existence několika změnami. Původní techniky byly vylepšeny a
objevily se nové. Nejdůležitější však stále zůstává úprava záznamu pomocí modelu
vnímavosti lidského sluchu (Perceptual Model). Kodér odstraňuje z původního
signálu frekvence, které jsou modelem vyhodnoceny jako nepotřebné - běžné ucho
si nevšimne, že něco chybí. Matematický model simuluje vnímavost lidského
sluchu, má definovány jeho slabiny a nedokonalosti, proto je schopen určit, co
dát pryč. Dalším postupem je tzv. Joint Stereo. Na obou kanálech stereozáznamu
je často stejný signál, Joint Stereo tuto přebytečnou informaci redukuje.
Některé kodéry podporují tzv. variabilní bitrate - klidné pasáže skladby jsou
zaznamenány nízkou bitrate a dynamické naopak vysokou bitrate. MP3 využívá ještě
několik dalších postupů, ty však už nejsou tak důležité.
Druhy MP3
MP3 je jeden z velké skupiny
kompresních algoritmů MPEG, všechny druhy MPEG standardů realizují ztrátovou
kompresi. MPEG (Moving Picture Experts Group) pracuje pod vedením International
Standards Organization (ISO) a International Elektro-Technical Commission (IEC)
a zabývá se kódováním videa a audia. MPEG standardy se dělí:
Každý standard obsahuje několik částí, které popisují kódování audia, videa, synchronizačních dat a formáty uložení kódovaných dat. MPEG standard obsahuje několik vrstev Layer I-III, které popisují kódovací schémata. Od Layer I do Layer III roste komplexnost a efektivita komprese zvuků, ale klesá rychlost kódování a dekódování. Zvuková schémata se dělí:
Pro dosažení 'CD' kvality je
tedy nutné použít u jenotlivých schémat rozdílných datových toků (bitrate). Při
použití Layer I se pro CD kvalitu doporučuje 384kbit/s,pro Layer II
256-192kbit/s a Layer III 128-112kbit/s. Z tohoto jednoznačně vyplývá, že Layer
III je i přes pomalé kódování jednoznačně nejvhodnější. Od této chvíle se tedy
budu zabývat jen MPEG 1 Layer III (MP3). Následující tabulka ukazuje 'výkon'
Layer III:
kvalita MP3 | mód | bitrate | kompresní poměr | max frekvence |
telefon | mono | 8kbit/s | 1:192* | 2.5kHz |
AM | mono | 32kbit/s | 1:48* | 7.5kHz |
FM | stereo | >64kbit/s | 1:24 | 12kHz |
CD-like | stereo | >96kbit/s | 1:16 | 16kHz |
CD | stereo | >128kbit/s | 1:12 | >16kHz |
*srovnání se stereo
Protože MP3ky pracují s několika kanálovým zvukem, objevují se zde termíny jako stereo, dual chanel, joint stereo, single chanel atd. Jednotlivé formáty jsou charakterizovány:
MPEG Audio soubor se fyzicky dělí na frames (rámce), které vždy obsahují hlavičku a data. Velikost každého rámce není konstantní a rámec končí hlavičkou dalšího. Hlavička obsahuje 4Byty.