Co je MP3?

Historie instantního zvuku
V roce 1987 začal Fraunhoferův institut integrovaných obvodů spolu s Dieterem Seitzerem (profesor Erlangenské univerzity) pracovat na novém formátu pro digitální zpracování zvuku. Tento formát měl umožnit efektivní kompresi digitálních zvukových záznamů s minimální ztrátou kvality. Klíč měl být nalezen v nedokonalosti lidského sluchu. Byl navržen mocný algoritmus, který je od roku 1989 znám jako MPEG Audio Layer-3 neboli MP3. Motion Pictures Experts Group (MPEG) dohlíží na standardy audiovizuálních datových formátů na Internetu. MP3 je součástí standardu audiovizuálního formátu MPEG-1.
 

Co to je MP3?
MP3 je formát zápisu zvukového signálu. Soubory MP3 jsou řádově veliké několik megabytů (MB). Jejich velikost je závislá na délce záznamu a na šíři datového toku (bitrate). Bitrate udává počet bitů, pomocí kterých je zapsána jedna vteřina záznamu. Čím větší bitrate, tím lepší kvalita, ale menší komprese a větší soubor. Dnes se nejvíce používá bitrate v rozmezí 128 až 192 kbps (kilo bit per second). Od 160 kbps je záznam téměř nerozeznatelný od originálu. Proč ale vlastně komprimovat?


Je rozdíl použít CD-ROM pro jedno album nebo pro třináct
Nekomprimované formáty (jako např. běžné zvukové CD) jsou pro zpracování počítačem nepraktické, neboť každá minuta záznamu v CD kvalitě zabírá přibližně 10 MB (megabytů). Album potom dosahuje průměrně velikosti 400 MB. To je i při velikostech dnešních pevných disků (desítky GB; 1 GB = 1000 MB) a CD-ROM (650 MB) příliš. Převodem do formátu MP3 lze tuto velikost zmenšit (s minimálními ztrátami kvality) přibližně desetkrát. Jedna minuta signálu tak odpovídá zhruba 1 MB (při bitrate 128 kbps). Čtyřminutovou píseň lze uložit do souboru o velikosti kolem 5 MB. Čtyřicetiminutové album MP3 zabere asi 50 MB. Na průměrný disk o velikosti 20 GB se vejde asi tak 400 alb. Na běžný CD-ROM potom třináct.
 

MP3 není žádné kouzlo, pouhé využití nedokonalosti
Algoritmus kódování MP3 je tak účinný díky několika základním postupům. MP3 prošlo za dobu své existence několika změnami. Původní techniky byly vylepšeny a objevily se nové. Nejdůležitější však stále zůstává úprava záznamu pomocí modelu vnímavosti lidského sluchu (Perceptual Model). Kodér odstraňuje z původního signálu frekvence, které jsou modelem vyhodnoceny jako nepotřebné - běžné ucho si nevšimne, že něco chybí. Matematický model simuluje vnímavost lidského sluchu, má definovány jeho slabiny a nedokonalosti, proto je schopen určit, co dát pryč. Dalším postupem je tzv. Joint Stereo. Na obou kanálech stereozáznamu je často stejný signál, Joint Stereo tuto přebytečnou informaci redukuje. Některé kodéry podporují tzv. variabilní bitrate - klidné pasáže skladby jsou zaznamenány nízkou bitrate a dynamické naopak vysokou bitrate. MP3 využívá ještě několik dalších postupů, ty však už nejsou tak důležité.
 

Druhy MP3
MP3 je jeden z velké skupiny kompresních algoritmů MPEG, všechny druhy MPEG standardů realizují ztrátovou kompresi. MPEG (Moving Picture Experts Group) pracuje pod vedením International Standards Organization (ISO) a International Elektro-Technical Commission (IEC) a zabývá se kódováním videa a audia. MPEG standardy se dělí:
   

Každý standard obsahuje několik částí, které popisují kódování audia, videa, synchronizačních dat a formáty uložení kódovaných dat. MPEG standard obsahuje několik vrstev Layer I-III, které popisují kódovací schémata. Od Layer I do Layer III roste komplexnost a efektivita komprese zvuků, ale klesá rychlost kódování a dekódování. Zvuková schémata se dělí:

Pro dosažení 'CD' kvality je tedy nutné použít u jenotlivých schémat rozdílných datových toků (bitrate). Při použití Layer I se pro CD kvalitu doporučuje 384kbit/s,pro Layer II 256-192kbit/s a Layer III 128-112kbit/s. Z tohoto jednoznačně vyplývá, že Layer III je i přes pomalé kódování jednoznačně nejvhodnější. Od této chvíle se tedy budu zabývat jen MPEG 1 Layer III (MP3). Následující tabulka ukazuje 'výkon' Layer III:
 
 

kvalita MP3 mód bitrate kompresní poměr max frekvence
telefon mono 8kbit/s 1:192* 2.5kHz
AM mono 32kbit/s 1:48* 7.5kHz
FM stereo >64kbit/s 1:24 12kHz
CD-like stereo >96kbit/s 1:16 16kHz
CD stereo >128kbit/s 1:12 >16kHz

*srovnání se stereo

Protože MP3ky pracují s několika kanálovým zvukem, objevují se zde termíny jako stereo, dual chanel, joint stereo, single chanel atd. Jednotlivé formáty jsou charakterizovány:

MPEG Audio soubor se fyzicky dělí na frames (rámce), které vždy obsahují hlavičku a data. Velikost každého rámce není konstantní a rámec končí hlavičkou dalšího. Hlavička obsahuje 4Byty.

Copyright ©2004 Linkin (Tomáš Klimeš)