Audio-Kompression: Fakten, Mythen und ein Blindtest

Audio-Kompression: Fakten, Mythen und ein Blindtest

David Lee
Zürich, am 09.01.2018
Bei der Komprimierung, etwa durch MP3, entsteht Verlust. Aber hört man das? Wo endet das feine Gehör und wo beginnt die Esoterik? Wir haben die Theorie mit einem Blindtest überprüft, den du auch selbst durchführen kannst.

Audio-Kompression begleitet uns im Alltag ständig: Fast immer, wenn du Musik hörst, ist sie komprimiert. Audio-Signalverarbeitung ist aber für Leute, die nicht auf diesem Gebiet arbeiten und eine entsprechende Grundausbildung haben, schwer zu verstehen. Dementsprechend – so mein Eindruck – kümmern sich die meisten Leute entweder gar nicht darum, oder sie verteufeln MP3 und alles, was irgendwie mit Kompression zu tun hat.

Die Frage lautet: Bringen wir uns um einen schönen Genuss, wenn wir Musik nur noch auf Spotify oder YouTube hören? Oder merkt man gar keinen Unterschied zur bestmöglichen Qualität?

Zahlen und was sie aussagen

Verschiedene Messgrössen sagen etwas über die Soundqualität aus – aber was genau? Hier die Faktoren möglichst kurz und verständlich im Überblick.

1. Bitrate

Die Bitrate sagt aus, wie viele Bits pro Sekunde verarbeitet werden. Sie wird auch Datenübertragungsrate oder Bandbreite genannt.

Es leuchtet intuitiv ein: Je mehr Daten durchfliessen, desto höher die Soundqualität. Die Bitrate ist im Alltag die wichtigste Messgrösse. Allerdings sagt die Bitrate allein noch nicht viel über die Soundqualität aus.

Es gibt variable und konstante Bitraten. Heute werden meist variable Bitraten (abgekürzt VBR) eingesetzt. In Passagen, wo «wenig passiert», kann ohne hörbaren Verlust stärker komprimiert werden, während bei komplexen Passagen relativ viele Daten gespeichert werden. Das Resultat ist eine höhere Soundqualität bei gleicher Dateigrösse. Bei variablen Bitraten wird als Wert der Durchschnitt angegeben, manchmal auch das zulässige Maximum.

2. Kompressionsverfahren

AAC komprimiert effizienter als MP3, so dass es bei gleicher Bitrate eine bessere Qualität liefert als MP3. Das gleiche gilt für Ogg Vorbis, der bei Spotify eingesetzt wird.

Auch die Komprimierungs-Software, der Encoder, hat einen Einfluss auf die Qualität. In der Anfangszeit von MP3 klangen Musikstücke mit 128 kbit/s oft fürchterlich. Mittlerweile klingen sie viel besser, weil keine schlechten Encoder mehr verwendet werden.

3. Bittiefe

Die Bittiefe sagt, wie viele Bits ein Sample/ein Abtastwert hat. Sie wird darum auch Samplingtiefe genannt. Je mehr Bits pro Sample, desto mehr unterschiedliche Lautstärkeabstufungen können gespeichert werden.

Das erinnert dich vielleicht an Foto und Video: Da gibts auch Bittiefen, und sie bedeuten auch etwas Ähnliches.

Das LG V30 kann *10bit-Videos** aufnehmen. Was bringt das? Ein Direktvergleich mit unserer Systemkamera.Video
placeholder

placeholder

Was ist besser: *RAW oder JPEG?**
placeholder

placeholder

Eine CD hat 16 Bit pro Stereo-Kanal. Bei MP3 und anderen komprimierten Audio-Dateien gibt es keine feste Bittiefe. Die Bittiefe spielt im normalen Alltag kaum eine Rolle, sondern nur bei Studioaufnahmen. Dort werden teilweise auch 24 bit verwendet, um bei der Soundbearbeitung mehr herauszuholen. Am Ende wird die Musik dann aber auf 16 bit heruntergerechnet, weil man den Unterschied laut Akustikexperten gar nicht hören kann.

Neil Young ist schuld, dass normale Konsumenten überhaupt über Bittiefe reden. Young verkauft einen Audio-Player namens Pono, der 24 bit beherrscht. Diese Seite spielt ein Stück von Neil Young in 16 bit und 8 bit (nicht 24!) Probier es aus: Schon dieser Unterschied ist schwierig zu hören. Von 16 vs. 24 bit wollen wir gar nicht erst reden.

4. Sample Rate

Die Sample Rate (auch Abtastrate genannt) spielt für normale Musikhörer ebenfalls keine Rolle. Sie ist aber wichtig fürs Verständnis, wie überhaupt die digitale Speicherung von Ton funktioniert. Eine CD hat eine Sample Rate von 44100 Hz oder 44,1 kHz. Hertz ist eine Masseinheit, die so etwas wie «Häufigkeit pro Sekunde» angibt. Beim Audio-Sampling bedeutet es, dass pro Sekunde 44100 Mal der Schallpegel gemessen wird. Auch hier gilt wieder: Bei Aufnahmen im Studio sind höhere Werte sinnvoll, nicht aber im Endformat.

Nyquist-Theorem: Viele Leute glauben, dass digitale Musik grundsätzlich ein Verlust gegenüber einer «echten» (analogen) Schallwelle ist. Diese Diskussionen kamen schon auf, als die CD erfunden und sofort von Audio-Snobs als minderwertig gegenüber der Schallplatte belächelt wurde. Das lässt sich aber widerlegen. Das Nyquist-Theorem besagt, dass man eine Audio-Kurve vollständig, ohne jeden Verlust, aus Einzelpunkten rekonstruieren kann, wenn die Abtastrate hoch genug ist. Und es sagt auch, wie hoch die Rate sein muss: doppelt so hoch wie die Bandbreite. Da das menschliche Gehör bis maximal 20 000 Hz geht, wird in etwa diese Bandbreite gewählt. Daher die Abtastrate von etwas über 40 000 Hz.

5. Andere Faktoren

Ob all der technischen Messgrössen darf man nicht vergessen, dass die besten Werte nichts nützen, wenn der Ton schon schlecht aufgezeichnet wurde. Wenn der Tontechniker zum Beispiel den Lautstärkepegel nicht hoch genug eingestellt hat, geht Dynamik verloren. Die Aufnahme fängt an zu rauschen, wenn sie im Nachhinein lauter gemacht wird. Ist der Pegel zu hoch, ist das Ergebnis noch schlimmer: die Aufnahme ist übersteuert, es scherbelt und kratzt. Oder dann verfremdet ein Dynamik-Kompressor das Ergebnis. Schlechte Aufnahmen sind auf Youtube allgegenwärtig und werden durchaus auch auf CD verkauft, etwa bei sehr alten Studioaufnahmen oder Live-Mitschnitten von Konzerten.

Eine Rolle spielt auch, wie gut deine Kopfhörer oder Boxen sind. Mit schlechten Mini-Böxchen wirst du kaum einen Unterschied zwischen MP3 in 128 kbit/s und unkomprimierter Musik hören. Mit guten Boxen schon eher.

So funktioniert der Blindtest

Ich habe für diesen Beitrag Blindtests mit zehn digitec-Mitarbeitern und Mitarbeiterinnen durchgeführt. Darunter hat es solche, die sich nie mit Audio-Qualität befassen und keine besonderen Ansprüche haben, und solchen, die sehr viel Wert darauf legen.

Junior Editor Ramon: «Habe schon ewig kein unkomprimiertes File mehr gehört»
Junior Editor Ramon: «Habe schon ewig kein unkomprimiertes File mehr gehört»
Chief Editor Aurel: «Challenge accepted!»
Chief Editor Aurel: «Challenge accepted!»

Das Testfeld setzt sich aus zwei Frauen und acht Männern zusammen. 7 von 10 Testern sind zwischen 25 und 30 Jahre alt, das Höchstalter liegt bei 40. Altersschwerhörigkeit kann man unseren Versuchskaninchen also nicht unterstellen. Sie bilden eine bunte Mischung aus Durchschnittshörern, Audio-Experten und Leuten, die auch selbst Musik machen. Die meisten verwenden meinen Sennheiser HD 449 als Kopfhörer, eine Person will ihre eigenen benutzen und eine macht den Test mit dem Logitech-Headset, das wir standardmässig im Büro verwenden.

Roy aus der Gaming-Abteilung hat Musik auf Profi-Niveau gemacht und eine Ausbildung zum Audio-Engineer begonnen. Rate mal was auf seinen Arm tätowiert ist.
Roy aus der Gaming-Abteilung hat Musik auf Profi-Niveau gemacht und eine Ausbildung zum Audio-Engineer begonnen. Rate mal was auf seinen Arm tätowiert ist.
Editor Luca meldet sich zum Test mit: «Bitzeli Musig lose – wieso nöd.»
Editor Luca meldet sich zum Test mit: «Bitzeli Musig lose – wieso nöd.»

Es gab drei Ausschnitte aus Musikstücken zu hören, aus unterschiedlichen Stilrichtungen (Klassik, Jazz, Pop/Rock). Die Clips dauern zwischen 30 und 45 Sekunden. Dazu habe ich jeweils die .wav-Datei in CD-Qualität (1411 kbit/s, PCM 16 bit) und mit LAME bzw. dem AAC-Encoder von Apple in verschiedene Kompressionsstufen heruntergerechnet:

  • MP3 V9 (niedrigste Qualitätsstufe, entspricht ca. 65 kbit/s VBR): Dies ist echt schlecht und wird im Alltag kaum je eingesetzt.
  • MP3 V5 (mittlere Qualitätsstufe, entspricht ca. 130 kbit/s VBR): Kommt beim Streaming noch vor, bei Downloads heute eigentlich nicht mehr.
  • MP3 V0 (höchste Qualitätsstufe, entspricht ca. 245 kbit/s VBR): Dies ist die Qualität, die im Amazon-Shop angeboten wird.
  • AAC 256 kbit/s: Dies sollte aufgrund des effizienteren AAC-Verfahrens noch besser sein als die höchste MP3-Stufe. Es ist die Qualität, die du im iTunes Store bekommst.

Danach habe ich die Files in WAV/PCM zurückkonvertiert, damit die Dateien äusserlich nicht auf den ersten Blick unterscheidbar sind. Alle Files sind gleich gross.

Teste selbst: Du kannst diese Tests auch selbst durchführen, indem du die Files herunterlädst. Damit dies aber wirklich ein Blindtest ist, musst du den ZIP-Ordner extrahieren, bevor du ihn öffnest. Denn nur ungezippt sind die Dateigrössen identisch.

Junior Editor Tanja: «Ich habe kein besonders feines Gehör.»
Junior Editor Tanja: «Ich habe kein besonders feines Gehör.»
Senior Editor Léonie: «Ich höre die hohen Töne aus den Geräten mit denen Tauben verscheucht werden.»
Senior Editor Léonie: «Ich höre die hohen Töne aus den Geräten mit denen Tauben verscheucht werden.»

Ergebnisse und Interpretation

Ich hatte ursprünglich vor, jede Person kurz vorzustellen, und dann die individuellen Ergebnisse dazuzuschreiben. Im Lauf des Experiments hat sich aber herausgestellt, dass das recht langweilig geworden wäre. Denn egal ob Gelegenheitshörerin oder Audio-Freak, das Ergebnis war immer etwa das gleiche.

Alle Testmeerschweinchen konnten recht schnell und sicher die schlechteste Qualität (MP3 mit VBR 65 kbit/s) identifizieren. Einzig bei der Klassik schafften das zwei Personen nicht. Die übrigen vier Qualitätsstufen wurden aber wild verwechselt und die Probanden gaben auch alle an, dass sie da unsicher seien oder sogar komplett raten mussten. Die Trefferquote lag da jeweils so im Bereich von 20%.

Bemerkenswert finde ich, dass die zweitschlechteste Datei nicht häufiger richtig bestimmt wurde als die drei besten. Die vermeintlichen Experten waren diesbezüglich auch nicht besser als die, die sich als Durchschnittshörer bezeichneten. Das habe ich so nicht erwartet, denn nach allem, was ich gelesen hatte, müsste man diese Stufe noch unterscheiden können. Durchschnittliche (variable) Bitraten von 192 kbit/s und mehr gelten bei MP3 (VBR) in den meisten Fällen als nicht vom Original unterscheidbar (Quelle). Unsere zweitschlechteste Stufe liegt mit ca. 130 kbit/s VBR deutlich darunter.

Audio-Experte Dimitri kennt solche Tests. Er macht sich keine Illusionen und nur vier Angaben. Die stimmen dann wenigstens.
Audio-Experte Dimitri kennt solche Tests. Er macht sich keine Illusionen und nur vier Angaben. Die stimmen dann wenigstens.
Hobbymusiker und Audio-Spezialist Fabio verzweifelt zusehends. Am Anfang schien noch alles klar – dann immer weniger.
Hobbymusiker und Audio-Spezialist Fabio verzweifelt zusehends. Am Anfang schien noch alles klar – dann immer weniger.

Die Testpersonen haben keinerlei Hinweise erhalten, worauf sie in welchen Passagen hören müssen. Sonst wäre das Ergebnis womöglich etwas besser ausgefallen. Aber mir ging es darum, die Alltagssituation zu simulieren. Wir hören in unserer Freizeit Musik, weil wir Musik lieben. Und nicht, weil wir es geil finden, Kompressionsmängel zu identifizieren.

Und noch ein ahnungsloses Opfer aus unserer Audio-Abteilung: Marketing-Spezialist Thomas.
Und noch ein ahnungsloses Opfer aus unserer Audio-Abteilung: Marketing-Spezialist Thomas.
Wollen wir das greise Alter von Senior Editor Phil (35) als Ausrede gelten lassen? Nein. Wollen wir nicht.
Wollen wir das greise Alter von Senior Editor Phil (35) als Ausrede gelten lassen? Nein. Wollen wir nicht.

Du kannst natürlich gegen diesen Test einwenden, dass er nicht unter optimalen Bedingungen stattfand. Mit absoluten Spitzen-Kopfhörern, speziellem Wiedergabegerät und in absoluter Stille hört man eventuell mehr heraus. Aber mein Standpunkt war, dass man das so testen sollte, wie man es im Alltag meist antrifft. Ich habe deshalb ganz bewusst ein Durchschnitts-Szenario gewählt. Klar ist: Wenn du auf unkomprimierte Musik schwörst, reicht es nicht, einfach nur entsprechende Files zu verwenden, sondern du brauchst dann alles in einer High-End-Version: Kopfhörer oder Boxen, Verstärker beziehungsweise Abspielgerät, und eventuell sogar die Kabel ...

Spezialfall YouTube

Die meisten Youtube-Videos verwenden AAC mit 128 kbit/s. Das würde reichen, denn in unseren Blindtests konnten die Leute nicht einmal MP3 mit der gleichen Bitrate identifizieren – und AAC ist wesentlich besser. Trotzdem höre ich einen Unterschied zwischen meiner Musik ab Festplatte und vielen YouTube-Videos. Vermutlich hat das damit zu tun, dass diese Audiofiles mehrfach umgewandelt werden. Schon wenn du Sound in den Video-Editor ziehst und das Video dann exportierst, wird es in der Regel eine Kompression angewendet. Beim Hochladen auf YouTube wird dann das bereits komprimierte File nochmals umgewandelt.

Ich habe versucht, das zu testen, indem ich ein Video mit WAV-Sound und mittelmässigem MP3 gemacht habe. Beim Exportieren habe ich darauf geachtet, dass keine Audiokompression abläuft. Es sind die gleichen Dateien wie im Blindtest, den du herunterladen kannst. Ich stelle keinen deutlichen Unterschied fest – aber hör selbst.

Schlussfolgerungen

Die Kompressionsverfahren werden immer besser. Variable Bitraten, bessere Codecs und optimierte Encoder liefern heute eine Qualität, bei der es verdammt schwer bis unmöglich ist, normal komprimierte Files von CD-Qualität zu unterscheiden.

Wer bei Amazon oder Apple Files kauft, ist auf der sicheren Seite. Da hörst du keinen Unterschied und hast sogar noch Reserven. Ebenso, wenn du Spotify in der bestmöglichen Qualität streamst. Details dazu. Wie erwähnt ist der verwendete Codec Ogg Vorbis besser als MP3, daher sind selbst 96 kbit/s noch akzeptabel.

Problematisch ist komprimiertes Material, wenn es erneut komprimiert wird. Auch hier bin ich aber nach meinem YouTube-Test nicht mehr sicher, ob das wirklich so schlimm ist. Jedenfalls ist es keine gute Idee, deine Musiksammlung von MP3 in AAC umzuwandeln, nur weil dies der bessere Codec ist. Auch eigene Musikaufnahmen solltest du grundsätzlich unkomprimiert zur Verfügung haben und nur zum Anhören in ein MP3 oder AAC exportieren. Bei Bluetooth wird ebenfalls komprimierte Musik erneut komprimiert. Hier hat es aber in den letzten Jahren grosse Fortschritte gegeben. Bei einem hochwertig komprimierten File und einem hochwertigen Bluetooth-Codec sollten keine Mängel mehr zu hören sein.

Abgesehen vom Problem der Doppelkomprimierung sehe ich nach diesem Test die ganze Sache mit der Audio-Kompression sehr entspannt. Ich muss mir keinen Stress machen mit irgendwelchen Super-Duper-FLAC-Files, die dann auf meinem Smartphone wieder nicht laufen. Ich glaube, die «Generation Spotify», die sehr sorglos mit dieser Thematik umgeht (respektive sich gar nicht drum kümmert), liegt nicht so falsch. MP3 ist in der heute üblichen Qualität gut genug und läuft überall – seit April 2017 sogar lizenzfrei.

68 Personen gefällt dieser Artikel


David Lee
David Lee
Senior Editor, Zürich
Durch Interesse an IT und Schreiben bin ich schon früh (2000) im Tech-Journalismus gelandet. Mich interessiert, wie man Technik benutzen kann, ohne selbst benutzt zu werden. Meine Freizeit ver(sch)wende ich am liebsten fürs Musikmachen, wo ich mässiges Talent mit übermässiger Begeisterung kompensiere.

Diese Beiträge könnten dich auch interessieren