Empiirium -- Peeter Marveti kodulehe päis. Aga mis on empiirium?

[ MÕTTED ]

[ Ajaviite- tehnika ] [ Helitöötlus ]

Digitaalne helitöötlus

Kuna selle teema all on hetkel vaid üks jutt (neid tuleb äärmiselt suure tõenäosusega kohevarsti juurde, ja tõenäoliselt ka sektsioone, kuid seda hiljem -- kõigepealt tahan neid kahte teemat korralikult täita), siis jääb seisukord sedapuhku ära. Olgu aga järgnev bulletiga lõik vihjeks sellest, et kunagi saab see index.html olema hoopis sisukord.

  • PAKITUD MUUSIKA – erinevate digitaalsete muusika pakkimisalgoritmide pakutavast tegelikulst helikvaliteedist.

Pakitud muusika

Digitaalkujul muusika pakkimine on viimasel ajal tõhusalt arenenud ja seeläbi ka inimestele käeulatusse jõudnud. Kellele arvutite maailmas ja Internetis .MP2 ja .MP3 failide näol, kellele koduses ja professionaalses tehnikas MiniDiskide kujul, kellele digitaalse video ja digitaalse satelliittelevisiooni osana. Enamik inimesi, kes sellega põgusalt kokku puutuvad, räägivad sellest vaimustunult kui iga ilmaga praktiliselt "CD kvaliteediga" muusikat andvast süsteemist. Ja sellest, kui viimasepeal hea kvaliteedi neist uusim arvutitele kättesaadav MPEG Audio Layer 3 annab. Pärast nimetatud vahendite ohjeldamatut uudishimulikku võrdlemist erinevates oludes, on mul igatahes tekkinud kõva tahtmine mõningaid muusika pakkimisega seotud müüte ümber lükata.

Müüt nr.1
nimetatud pakkimisalgoritmid annavad praktiliselt CD kvaliteediga heli

Nii pealiskaudselt öeldud väitele vaidlen igatahes kategooriliselt vastu. Alles praegu, mil uusimad MiniDisk-i pakkijad (ATRAC-4 ja uuemad) suudavad pakkida nii piisavalt hästi, et audiofiilid hakkavad alles nüüd tunnistama, et MiniDisk kvalifitseerub millekski paremaks kui kompakt-kassett, siis tasub ehk natuke rääkida sellest, mis see siis on, mis pakkimiste puhul kaotsi läheb ja millal seda kuulda on. Seda enam, et MiniDisk-i ATRAC-4 on subjektiivselt tasemelt ikka peajagu üle suvalisest MPEG Audio pakkijast arvutitel.

Esimene ja olulisim, mis kõikide pakkimisalgoritmide juures väheneb on ruumitunnetus, "kohalolekutunne". See tunne, mis lubab silmade kinnipanekul ette kujutada, et oled saalis ja su ees laval mingid sellid mängivad mingeid pille ja keegi toob suuga kummalisi helisid kuuldavale. Et kus keegi midagi teeb, mis laadi ruumis sa tunned end olevat. See kõik väheneb. MiniDisk-i ATRAC-4 korral mitte eriti oluliselt. MPEG Audio Layer 3 puhul, kui kasutada soovituslikke pakkimistihedusi, ikka päris oluliselt. Tuleneb see efekt sellest, et nimetatud pakkimisalgoritmid kõik sisaldavad loogikat, et igal ajahetkel ignoreeritakse mingist piirist nõrgemaid helisid, mis klassikalises tähenduses kõrvale kuuldamatud peaksid olema (What HiFi ütles pakkimise kohta andeka lause: "[data compression] removes signals, it’s designers think you can’t hear"). Suvalises reaalses musikaalses helis on aga terve müriaad kõiksugu seintelt peegeldunud helide komponente, mis on kõrvale vaevalt kuuldavad ja kui täpne olla, siis nende olemasolu inimene endale täielikult ei teadvustagi. Talle tekib ainult vaevaltmärgatav tunne, et seal kandis on vist sein. Pakkimine lõikab välja arvestatava osa sellist informatsiooni kandvatest helidest.

Jah loomulikult, seda vahet ei kuule, kui ühendada mingid väikesed plastmassist valjuhääldid arvuti helikaardi sisemise võimendi väljundisse. Kui aga sama muusikat kuulata vähegi normaalse võimendi taga (normaalsust hakkab leidma umbes 2.4KEEK-i kandist) normaalsetest kõlaritest (normaalsust hakkab leidma umbes 1.8KEEK-i kandist), siis hakkab vahe välja kostma. Muidugi ei panda seda enamasti ka siis tähele, kuna võrdlusmomenti ei teki või siis ei vaevuta lihtsalt võrdlema.

Ülejäänud erinevused on juba algoritmispetsiifilisemad.

Viimastel MiniDisk-idel (ATRAC-4), ainus häda peale eelmainitu, mida mina olen pärast hoolikat kuulamist suutnud tuvastada on, et ta küll taastab kõrgete helide kõla meeldivalt täpselt, aga ei suuda alati täpselt taastada kõrgete helide ärske algusi ja lõppe. Kujutame näiteks ette, et muusikas lüüakse metalse asjaga metalltaldriku pihta. Tekkiv heli on suhteliselt harilik metalse kõlaga taldriku "tsahh". Selle tsahhi alguses on originaalis aga spetsiifiline kõlks, mis tekkis taldriku vastu puutumise hetkel. Need järsud üleminekuhetked aga ühtlustab ATRAC-4 natuke ära. Nii, et see krõps sealt algusest kaoks nagu märksa vähemaks ja see "tsahh" jääb nagu põhiliseks mis välja kostab.

Jah, ma annan aru, et ka see, on tegelikult vägagi minimaalne erinevus. See on ka tegelikult üks mu pointe, et MiniDiski viimased inkarnatsioonid on tõesti peaaeegu saavutanud selle müstilise CD-kvaliteedi, nii et vahed on väga väikesed. Isegi ruumitaju vähenemine on väga vähe tajutav.

Teiste algoritmidega pole aga asi nii roosiline.

MPEG Audio Layer 2 salvestajaga (CoolEdit96) kajastub välja jäetud info esmajärjekorras selles, et kõrged helid muutuvad ebatäpseks, ehk maakeeli öeldes moonutuvad. Subjektiivne kommentaar selle kohta oleks, et kõrged hakkavad hästi kummaliselt sufisema. Kusjuures muutlikult susisema. Lisanduvad moonutused ka muusse helisse.

MPEG Audio Layer 3 salvestajaga (L3Enc) kajastub välja jäetud info aga kõige vastikumalt - kui kõik soovitud inff ära ei mahu, lõigatakse kõrged lihtsalt mingist piirist alates maha. Järsku ja nulliga. Lihtsalt ignoreeritakse mingist piirist kõrgemaid sagedusi. Samas aga väheneb ka signaali dünaamika. Kogu helipilt muutub kuidagi häguseks ja "paksuks". Kõige jubedam on veel aga see, et see piir millest kõrgemaid sagedusi ignoreeritakse muutub pidevalt vastavalt sellele, kuipalju vaba ruumi kodeerimiseks on. Ehk siis sellest, mis muud helis toimub. Üldmulje on kui lihtsalt ära lõigatud ja lisaks veel kummaliselt susisevad kõrged. Ja ahenenud dünaamika.

Müüt nr.2
MPEG Audio Layer 3 annab iga ilmaga Layer 2-st kvaliteetsema heli

... eriti madalamate bitrate-de korral. Müüt, mis müüt. See müüt peab vett juhul, kui MPEG Audio Layer 3 kasutab "joint stereo" kodeerimist ja Layer 2 ei kasuta. By default Layer 2 tõesti ei kasuta "joint stereo" kodeerimist. Keegi ei keela seda aga kasutada - CoolEdit96 MPEG Audio Layer 2 salvestaja optionite all on igatahes võimalik vajutada ristike checkboxi "joint stereo". Tulemust mängivad ikka suvalised share- ja freeware MPEG Audio Layer 2 pleierid. Ja kui tulemust näiteks maPlay v1.2+ -ga mängida, on tulemus suvalise stereotööks mõeldud bitratega minu arvates oluliselt parem kui praegu kättesaadava Fraunhoferi instituudi MPEG Audio Layer 3 pakkijaga.

Kui soovite kuulda võrdlust, siis imege endale näiteks lugu "Bolshie Boy" ansamblilt Dreamphish. Dream4.mp2 ja Dream4.mp3. Konkreetne lugu on mõlemas formaadis kodeeritud 112 kb/s tihedusega joint stereo reziimis. Tähelepanuväärne on see, et kui Layer 3 mehed ennast kiidavad, väidavad nad, et Layer 2 sureb juba alla 160-192 kb/s tihedustel täielikult. Mina väidan, et isegi 112 kb/s tihedusega on Layer 2 praeguses inkarnatsioonis tasemelt täiesti võrreldav Layer 3-ga ja kontekstides kus sellist tihedust üldse pruukida tasub (muusika üle Interneti), mõnevõrra paremgi. Märgiks veel ka seda, et .mp3 versioonide pakkimisel keerasin ma kõrgeid "ekvalaiseriga" natuke üleski, et "poolkõrgetega" veidigi kompenseerida totaalselt ära lõigatud päris kõrgeid helisid. Ilma selle liigutuseta, tundus .mp3 päris mannetu. Kui tahate kuulda, kuidas originaal kõlas, kuulake Dream4.mp3. See on 320 kb/s maksimaalse kvaliteediga pakitud versioon.

Nii. Konkreetne lugu oli pakitud 112kb/s. WinPlay3 readme-s kuulutatakse, et 96 kb/s tihedusega saadakse "near-CD" kvaliteet ja et selle 112 kb/s ja 128 kb/s tihedustega saadakse "CD" kvaliteet. No kui see on CD kvaliteet, olen mina pizza. Jah ma tean, et see lugu on mõlema pakkimisalgoritmi vaatevinklist üks jubedamaid võimalikke. Sellegipoolest.

Pärast pikki katsetusi erinevate tihedustega on minu praegune arvamus MPEG Audio Layer 3 pakkimisvõimest (eeldusel, et originaaliks oli digitaalselt salvestatud lugu) järgmine:

  • 96 kb/s - kesklaine-raadio-st veidi parem, ainult et stereo.
  • 112 kb/s - hakkab meenutama ULL-raadiot, aga ikka kehvem veel
  • 128 kb/s - "peaaegu Uuno raadio", ainult et vähegi keerulised susinad rikub ära
  • 160 kb/s - ULL-raadiost parem, võhik ei tee CD-ga praktiliselt vahet, nõudlikuma kuulaja jaoks rahuldab, kuigi vahe on korraliku tehnikaga kuuldav
  • 192 kb/s - digitaalse originaali korral pole vahet praktiliselt kuulda

Kui originaal on analooglindilt pärit, siis võib öelda, et 160kb/s rikub susisevad kõrged ikka põhjalikult ära; 192 kb/s on peaaegu rahuldav (kui analoogmakk on korralik) ja 256kb/s annab korraliku tulemuse, mida originaalist praktiliselt ei erista.

Kogu selle pildi juures on nukker see, et MPEG Audio Layer 2 korral on minu subjektiivne mulje erinevate pakkimistiheduste korral umbes sama. Erinevalt Layer 2 pakkijatest on aga Layer 3 pakkijad sellised, et 160 kb/s, 192 kb/s ja 224 kb/s tihedusi kasutada ei lasta. Registreerimata programmi korral ei lasta 128 kb/s tihedustki kasutada.

Minu isiklik hinnang kogu süsteemile on aja jooksul kujunenud selliseks, et arvuti kõrval olevate plastik-kõlarite tarbijatele on Fraunhoferi Instituudi pakutav MPEG Audio Layer 3 hea küll - üle interneti muusika kantimiseks 128 kb/s tihedusega näiteks. Samas aga oleks Layer 2 ka selleks mõistlikum kuna selle eest ei pea keegi Fraunhofer-ile üüratuid rahasid maksma (l3enc registreerimine eeldab >2000EEK tasu mis on metsikult kõrge nii jaburate piirangutega programmi kohta) ja kuulamisprogrammid on täiesti tasuta.

 

(c) 1996, 1997 Sulo Kallas ja Goodwin. All Rights Reserved. Viimased uuendused 19-04-1997 23:29.
Kõik siin web' is leiduvad failid on meie teada vabaks levitamiseks lubatud või on meil asjakohane luba; kõikide tekstis mainitud kaubamärkide kuulumist nende omanikele tunnistame.
Kasutajatel lubatud siin web'is leiduvast teha 1 (üks) väljatrükk isiklikuks tarbeks; muudel puhkudel (kasutamine koolituseks jms) küsib viisakas inimene kirjalikku luba Sulo Kallas'elt (
sulo@goodwin.ee).