Compressione audio: fatti, miti e test cieco

Compressione audio: fatti, miti e test cieco

David Lee
Zurigo, il 09.01.2018
Responsabile di traduzione/revisione: Alessandra Ruggieri De Micheli
La compressione audio, ad esempio tramite MP3, provoca una perdita di qualità. Ma ce ne accorgiamo davvero? Qual è il confine tra udito fine e pura convinzione? Nel tentativo di svelare questo mistero, abbiamo condotto un test cieco che puoi fare anche tu a casa.

La compressione audio ci accompagna nella vita di tutti i giorni: la maggior parte della musica che ascoltiamo è compressa, ma l'elaborazione dei segnali audio è difficile da comprendere per le persone che non lavorano in questo campo e non hanno una formazione di base. Di conseguenza, ho l’impressione che la maggior parte delle persone non se ne preoccupi affatto oppure demonizzi l’MP3 e tutto ciò che ha a che fare con la compressione.

La domanda è: ci priviamo davvero di un piacere, ascoltando esclusivamente musica su Spotify o YouTube? Oppure non si nota alcuna differenza rispetto alla musica della migliore qualità?

Numeri, misure e cosa significano

Ci sono diversi metodi per misurare la qualità dell’audio, ma a cosa si riferiscono esattamente? Ho cercato di descriverli nel modo più chiaro possibile.

1. Bitrate

Il bitrate è il numero di bit elaborati al secondo. Si chiama anche «velocità di trasmissione dati» o «larghezza di banda».

È una misurazione intuitiva: maggiore è il numero di dati trasmessi, migliore è la qualità del suono. Il bitrate è l'unità di misura più utilizzata, ma da sola fornisce poche informazioni sulla qualità dell’audio.

I bitrate possono essere variabili o costanti. Attualmente, per lo più vengono utilizzati bitrate variabili (abbreviati a VBR). In sequenze più «silenziose», il suono può essere compresso di più senza perdite di qualità, mentre sequenze più complesse richiedono la registrazione di un maggior volume di dati. Il risultato: una migliore qualità del suono in un file con le stesse dimensioni. I bitrate variabili vengono calcolati come valore su una media o, talvolta, dal massimo consentito.

2. Procedura di compressione

L’AAC comprime in modo più efficiente rispetto all'MP3, quindi offre una qualità migliore allo stesso bitrate. Lo stesso vale per Ogg Vorbis, che viene utilizzato da Spotify.

Anche il software di compressione, l'encoder, influisce sulla qualità. Quando l’MP3 era appena nato, nelle tracce con 128 kbit/s l’audio era spesso terribile. Oggi però non si usano più encoder così pessimi e di conseguenza la qualità dell’audio è molto più elevata.

3. Profondità di bit

La profondità di bit indica la quantità di bit presenti in ogni campione. Si chiama anche «profondità di campionamento». Maggiore è il numero di bit per campione, maggiore è la quantità di livelli di volume diversi che possono essere memorizzati.

Questo termine forse può farti pensare alle foto o ai video, dove esiste un concetto simile.

Das LG V30 kann *10bit-Videos** aufnehmen. Was bringt das? Ein Direktvergleich mit unserer Systemkamera.video
placeholder

placeholder

Was ist besser: *RAW oder JPEG?**
placeholder

placeholder

Un CD ha 16 bit per canale stereo. Gli MP3 e altri file audio compressi non hanno una profondità di bit definita, che riveste un ruolo essenziale solo durante una registrazione audio. 24 bit sono talvolta utilizzati anche per ottenere di più dall'elaborazione del suono. Alla fine però la musica scende a 16 bit perché, secondo gli esperti di acustica, la differenza è appena percettibile.

Se l’ascoltatore medio ha iniziato a parlare di profondità di bit è per via di Neil Young. Secondo la leggenda popolare che lo vede protagonista, Young commercializza un lettore audio chiamato Pono, che ha 24 bit. Questo sito trasmette un pezzo di Neil Young in 16 bit e 8 bit (non 24!). Prova ad ascoltarli: la differenza è appena percettibile. Non parliamo nemmeno di un confronto tra 16 e 24 bit!

4. Frequenza di campionamento

Anche la frequenza di campionamento (nota anche come «Sample Rate») non è importante per l’ascoltatore medio, a meno che non voglia capire come funziona la memorizzazione digitale del suono. Un CD ha una frequenza di campionamento di 44,100 Hz o 44,1 kHz. Hertz è un'unità di misura che indica un qualcosa di simile alla «frequenza al secondo». Tornando al campionamento audio, questo significa che il livello sonoro viene misurato 44’100 volte al secondo. Anche in questo caso, in studio sono preferibili valori più alti, ma non nel formato finale.

Teorema di Nyquist: molti pensano che la musica digitale abbia subito una complessiva perdita di qualità rispetto alle onde sonore «reali» (analoghe). Questo argomento era già stato affrontato appena era nato il CD, deriso dagli snob dell’audio: lo denigravano e lo consideravano inferiore al vinile. Tuttavia, le loro idee sono confutabili. Infatti, secondo il teorema di Nyquist, è possibile ricostruire un'intera curva audio da singoli campioni senza perdite di qualità, a condizione che la frequenza di campionamento sia sufficientemente elevata. Il teorema afferma inoltre che la frequenza debba essere il doppio della larghezza di banda. Dal momento che il nostro udito non percepisce più di 20,000 Hz, viene selezionata questa larghezza di banda. Da qui la frequenza di campionamento leggermente superiore a 40’000 Hz.

5. Altri fattori

Se dobbiamo prendere in considerazione tutti i parametri tecnici, non dimentichiamo che i valori migliori sono completamente inutili se il suono è stato registrato male in principio. Se, ad esempio, il tecnico del suono non ha impostato il volume a un livello sufficientemente alto, la dinamica si perde. Se l'ascoltatore alza il volume, il suono si distorce. Se il volume dell’audio di partenza è troppo alto, il risultato è ancora peggiore: la registrazione è satura, il suono è distorto e graffiante. Anche un compressore può rovinare la dinamica sonora. Su YouTube è pieno di tracce di questo tipo, che vengono anche vendute come CD, soprattutto se si tratta di vecchie registrazioni o di concerti dal vivo.

Anche la qualità delle cuffie o degli altoparlanti gioca un ruolo importante. Con diffusori di piccole dimensioni e scarsa qualità, difficilmente sentirai la differenza tra MP3 con 128 kbit/s e musica non compressa. Con diffusori di qualità, invece, te ne accorgerai eccome.

T 5 P (Over-Ear, Argento, Nero)
899.95
Beyerdynamic T 5 P (Over-Ear, Argento, Nero)

Ecco come funziona il test cieco

Per questo articolo, ho sottoposto dieci dei miei colleghi e colleghe digitec a un test cieco. Alcuni di loro non attribuiscono grande importanza alla qualità audio della musica che ascoltano, altri invece sono molto esigenti.

Lo Junior Editor Ramon: «Non ascolto un file audio non compresso da secoli»
Lo Junior Editor Ramon: «Non ascolto un file audio non compresso da secoli»
Lo Chief Editor Aurel: Challenge accepted!»
Lo Chief Editor Aurel: Challenge accepted!»

Hanno partecipato al mio test due donne e otto uomini. 7 dei 10 tester sono di età compresa tra 25 e 30 anni, il più «anziano» ha 40 anni. Suppongo pertanto di poter escludere qualsiasi problema dell'udito legato all'età. Il gruppo è composto da ascoltatori medi, esperti del suono e persone che producono musica. Per il test, la maggior parte dei partecipanti ha utilizzato le mie cuffie Sennheiser HD 449. Uno di loro ha preferito usare le proprie cuffie, mentre un collega ha utilizzato le cuffie Logitech che di solito usiamo in ufficio.

Roy del reparto gaming ha prodotto musica a livello professionale e ha iniziato la sua formazione come tecnico del suono. Indovina cosa si è tatuato sul braccio.
Roy del reparto gaming ha prodotto musica a livello professionale e ha iniziato la sua formazione come tecnico del suono. Indovina cosa si è tatuato sul braccio.
L’Editor Luca afferma: «Ascoltare un po’ di musica? Perché no?»
L’Editor Luca afferma: «Ascoltare un po’ di musica? Perché no?»

Ho fatto ascoltare loro tre brani in stili diversi (classico, jazz, pop/rock) per 30-45 secondi. A questo scopo, ho ridotto il file .wav in qualità CD (1411 kbit/s, PCM 16 bit) e con LAME o l'encoder AAC di Apple fino a diversi livelli di compressione:

  • MP3 V9 (è il livello di qualità più basso e corrisponde a circa 65 kbit/s VBR): è davvero pessimo e non viene quasi mai usato nella vita di tutti i giorni.
  • MP3 V5 (è il livello di qualità medio e corrisponde a circa 130 kbit/s VBR): oggi lo troviamo ancora durante lo streaming, ma non nei download. MP3 V0 (è il livello di qualità più alto e corrisponde a circa 245 kbit/s VBR): Questa è la qualità offerta nel negozio Amazon.
  • AAC 256 kbit/s: Grazie all processo AAC più efficiente, dovrebbe essere ancora migliore della qualità più elevata di MP3. Questa è la qualità che trovi nell’iTunes Store.

Successivamente ho riconvertito i file in WAV/PCM in modo che non fossero distinguibili a prima vista. Tutti i file avevano le stesse dimensioni.

Fai il test: puoi fare anche tu questo test: non devi fare altro che scaricare i file. Ma perché sia veramente un test cieco, devi estrarre la cartella ZIP prima di aprirla. Solo i file non zippati hanno le stesse dimensioni.

La Junior Editor Tanja: «Ho un udito molto fine.»
La Junior Editor Tanja: «Ho un udito molto fine.»
La Senior Editor Léonie: «Sento persino gli ultrasuoni dei dispositivi che si usano per allontanare i piccioni.»
La Senior Editor Léonie: «Sento persino gli ultrasuoni dei dispositivi che si usano per allontanare i piccioni.»

Risultati e interpretazione

Inizialmente avevo pensato di presentare brevemente ogni persona e poi aggiungere i risultati individuali. Nel corso dell'esperimento, tuttavia, ho realizzato che la cosa sarebbe stata piuttosto noiosa. Tanto, che il partecipante fosse fissato con la qualità dell’audio o si considerasse un semplice ascoltatore medio, il risultato è stato lo stesso.

Tutte le cavie del mio esperimento sono state in grado di identificare la qualità più scadente (MP3 con VBR 65 kbit/s) piuttosto in fretta e senza problemi. Solo con la musica classica non ci sono riusciti in due. Tuttavia, gli altri quattro livelli di qualità sono stati ampiamente confusi e tutti i soggetti sottoposti al test hanno dichiarato di essere stati incerti o addirittura di aver tirato completamente a caso. Il tasso di successo è stato di circa il 20%.

Trovo interessante che il penultimo file in termini di qualità sia stato identificato correttamente meno frequentemente rispetto ai tre file di qualità migliore. I cosiddetti esperti non si sono rilevati molto più bravi di quelli che si consideravano normali ascoltatori. Non me lo sarei aspettato, questo, perché da tutto quello che avevo letto, questo livello avrebbe dovuto essere ancora facilmente riconoscibile. Nella maggior parte dei casi, si ritiene che i bitrate (variabili) medi di 192 kbit/s o superiori nel formato MP3 (VBR) non possano essere distinti dalla sorgente. Con circa 130 kbit/s di VBR, la qualità del penultimo livello è nettamente inferiore a questi valori.

Dimitri è un esperto del suono. Conosce questo tipo di test. Non ha illusioni e si pronuncia solo quattro volte. Almeno queste risposte sono tutte corrette.
Dimitri è un esperto del suono. Conosce questo tipo di test. Non ha illusioni e si pronuncia solo quattro volte. Almeno queste risposte sono tutte corrette.
Fabio è un musicista amatoriale e specialista del suono. All’inizio aveva tutto sotto controllo. Poi ha perso le speranze.
Fabio è un musicista amatoriale e specialista del suono. All’inizio aveva tutto sotto controllo. Poi ha perso le speranze.

Non ho detto ai miei partecipanti a quali elementi avrebbero dovuto prestare attenzione durante l'ascolto. I risultati avrebbero potuto essere migliori, ma volevo simulare le situazioni della vita quotidiana. Nel nostro tempo libero ascoltiamo la musica perché ci piace, non perché vogliamo identificare le perdite di qualità dovute alla compressione sonora.

Questo è Thomas specialista di marketing e vittima innocente del nostro test.
Questo è Thomas specialista di marketing e vittima innocente del nostro test.
L'età del nostro Senior Editor Phil (35 anni) dovrebbe giustificare i suoi risultati? No. Decisamente no.
L'età del nostro Senior Editor Phil (35 anni) dovrebbe giustificare i suoi risultati? No. Decisamente no.

Naturalmente puoi rimproverarmi di non aver effettuato il test in condizioni ottimali. Con cuffie all'avanguardia, uno speciale dispositivo di riproduzione e un silenzio perfetto, probabilmente è molto più facile percepire le differenze. Ma la mia idea era quella di testare l’audio così come lo ascoltiamo nella vita di tutti i giorni, quindi ho scelto deliberatamente di effettuarlo in condizioni normali. Certo, se sei un fedelissimo della musica non compressa, usare i file non compressi corrispondenti non è sufficiente. Hai bisogno di cuffie, altoparlanti, amplificatori, cavi e dispositivi di riproduzione di alta qualità.

Il caso speciale di YouTube

Il formato AAC 128 kbit/s è utilizzato nella maggior parte dei video di YouTube. Sicuramente è sufficiente, perché durante il mio test i partecipanti non sono nemmeno riusciti a identificare i file MP3 con lo stesso bitrate – e il codec AAC è decisamente migliore. Tuttavia, noto una differenza tra la musica sul mio disco rigido e quella di molti video su YouTube. Credo che questi file audio siano stati convertiti più volte. Di solito, l’audio viene già compresso quando si importa nell'editor prima di esportare il video. E il file viene nuovamente compresso quando il video viene caricato su YouTube.

Ho provato a testare l’audio su YouTube con un video con audio WAV e un MP3 medio. Ho fatto in modo che l’audio non venisse compresso durante l'esportazione. Ho usato gli stessi file del test cieco, che puoi scaricare anche tu. Non percepisco alcuna differenza netta. Ma ascolta anche tu.

Conclusioni

I processi di compressione vengono costantemente migliorati. Bitrate variabili, codec migliori ed encoder ottimizzati garantiscono una qualità dell’audio che rende estremamente difficile, se non impossibile, trovare una differenza tra file compressi e CD di qualità.

Chi compra su Amazon o da Apple va sul sicuro. Non sentirai alcuna differenza e avrai ancora del margine. La stessa cosa vale per lo streaming di musica su Spotify, che offre la migliore qualità disponibile. Per saperne di più, leggi [qui](https://support.spotify.com/it/article/high-quality-streaming/ /). Come accennato in precedenza, il codec Ogg Vorbis è migliore dell'MP3, quindi anche 96 kbit/s sono ancora accettabili.

I problemi sorgono quando si comprime un file che è già stato compresso in precedenza. Ma, dopo il mio test su YouTube, non sono più del tutto sicuro che il risultato sia poi così pessimo. In ogni caso, convertire la tua collezione musicale da MP3 ad AAC solo perché questo è il codec migliore non è decisamente una buona idea. Fondamentalmente dovresti disporre anche delle tue registrazioni in formato non compresso ed esportarle in MP3 o AAC per ascoltarle. Anche il Bluetooth ricomprime audio già compresso, anche se in quest’ambito negli ultimi anni sono stati compiuti grandi progressi. Con un file compresso di alta qualità e un codec Bluetooth di alta qualità, non dovresti sentire alcun difetto.

A parte il problema della doppia compressione, dopo questo test mi sento molto più tranquillo. Non devo farmi problemi e pensare di utilizzare qualche improbabile file FLAC, che tanto poi non funziona mai sul mio smartphone. Credo che la «Generazione Spotify», che affronta questo argomento con molta disinvoltura (o forse non ha proprio alcun interesse a riguardo), non abbia tutti i torti. Oggi la qualità dell’MP3 in generale è abbastanza buona. Inoltre, l’MP3 si trova ovunque e, dal 2017, persino senza licenza.

A 67 persone piace questo articolo


David Lee
David Lee
Senior Editor, Zurigo
Il mio interesse per il mondo IT e lo scrivere mi hanno portato molto presto a lavorare nel giornalismo tecnologico (2000). Mi interessa come possiamo usare la tecnologia senza essere usati a nostra volta. Fuori dall'ufficio sono un musicista che combina un talento mediocre con un entusiamso eccessivo.

Potrebbero interessarti anche questi articoli