>> Elettronica Tecnologia >  >> Car Audio & Elettronica >> Auto Altoparlanti e Subwoofer

Che cos'è un file MP3?

Non puoi aver parlato di audio e computer in qualsiasi momento negli ultimi 15 anni e non aver sentito parlare di un file MP3. I file audio MP3 e i siti Web, come il Napster originale, hanno iniziato un cambiamento su dove, come e quando le persone acquisivano musica. Se sei all'estremità più vecchia dello spettro, come molti di noi nel settore dell'elettronica mobile, allora hai comprato i tuoi CD, cassette e forse anche il tuo vinile in un negozio di dischi. I computer e Internet lo hanno cambiato. Potresti andare online dopo cena e scaricare una copia illegale di una canzone in pochi minuti. Era sbagliato, ma le persone hanno acquisito decine di milioni di canzoni in questo modo.

Negli anni '90 e all'inizio degli anni 2000, l'accesso a Internet era lento. Abbiamo iniziato a connetterci a Internet utilizzando linee telefoniche e modem. Ogni byte di informazioni ha richiesto tempo per essere trasferito sul tuo computer, quindi tutto ciò che avrebbe accelerato il processo era un piacere. Scaricare (rubare) musica tramite Internet è il luogo in cui la popolarità del file audio MP3 ha incontrato la sua vocazione.

Una guida all'audio digitale

Potremmo scrivere 10 articoli sull'audio digitale e potremmo farlo. Per ora, esamineremo le basi e utilizzeremo il compact disc (CD) come riferimento. I CD memorizzano l'audio digitale campionato a 44,1 kHz con una risoluzione di 16 bit. Questi numeri indicano che ogni campione può avere un'ampiezza che è un valore singolo all'interno di un intervallo di 65.536 livelli diversi (da 2 a 16). Le informazioni vengono campionate 44.100 volte al secondo. Il campionamento a quello che è noto come 44.1/16 consente di acquisire la gamma udibile dell'audio (considerata da 20 Hz a 20 kHz) con buoni dettagli e precisione.

Per memorizzare 1 secondo di audio a questa risoluzione, dobbiamo memorizzare 1.411.200 bit di informazioni. Chiunque abbia giocato con un software di transcodifica audio può riconoscere 1.411 kbps come velocità dati standard. Questo numero viene calcolato moltiplicando il numero di bit per campione (16) per il numero di campioni al secondo (44.100) per 2. Il fattore times-2 è dovuto al fatto che registriamo in stereo, ovvero due canali. Quindi, un brano di 3 minuti è 254.016.000 bit o 31.752.000 byte.

Arrotondiamo a 31 megabyte di informazioni. Riesci a immaginare quanto tempo ci vuole per scaricarlo con un modem in esecuzione a 14.400 baud? La risposta è di almeno 3,5 minuti, senza controllo degli errori, rumore di linea e altri fattori che rallentano il tempo di download reale a circa 5,5 minuti.

Compressione dati

E se qualcuno trovasse un modo per ridurre le dimensioni del file audio per accelerare i tempi di download e ridurre l'utilizzo della larghezza di banda? L'avvertenza è che l'audio suona ancora essenzialmente lo stesso sulla maggior parte dei sistemi audio di base, come una TV, altoparlanti di computer o un'autoradio di fabbrica degli anni '90. Nel 1991, un gruppo di società, tra cui il Fraunhofer Institute, France Telecom, Philips, TDF e IRT, ha iniziato a lavorare su un modo per ridurre le dimensioni dei file mantenendo le informazioni pertinenti. Questa è la chiave per ridurre le dimensioni del file utilizzando la compressione MP3.

Il formato file MP3 è un algoritmo di "compressione con perdita". La compressione con perdita significa che le informazioni vengono eliminate per ridurre le dimensioni del file. Il team di sviluppo ha lavorato su un metodo di compressione chiamato codifica percettiva per decidere quali informazioni rimuovere. La codifica percettiva si basa su come ascoltiamo i suoni rispetto ad altre informazioni e sui limiti del nostro udito.

Cosa eliminano i file MP3

Analizzeremo le informazioni che i file MP3 rimuovono per ridurre le dimensioni del file. Uno dei modi più semplici per ridurre la memorizzazione delle informazioni è ridurre la frequenza più alta che verrà riprodotta. Se analizziamo un file MP3 a 128 kbps, vediamo che la frequenza più alta riprodotta è appena inferiore a 16 kHz. Se questa fosse l'unica informazione rimossa, il nostro nuovo bitrate con campioni a 16 bit in stereo sarebbe di circa 1.004.800 kbps invece di 1.411.200 kbps per 20,05 kHz.

La parte successiva del processo di compressione analizza i contenuti comuni a entrambi i canali. È comune che alcune parti di una registrazione siano virtualmente in mono. Il processo di codifica rimuove le informazioni duplicate dal file e aggiunge il codice per copiare il canale opposto. Se la traccia audio fosse puramente mono, la dimensione del file verrebbe divisa in due. Poche tracce sono completamente mono, ma possiamo vedere un maggiore risparmio di spazio da questo processo.

L'elaborazione successiva esamina le informazioni di basso livello durante i passaggi ad alta ampiezza. Usiamo l'esempio di una canzone con molti bassi e alcune informazioni di gamma media armoniche molto silenziose. I processi di codifica percettiva come MP3 rimuoveranno queste informazioni di basso livello dalla traccia audio. Questo processo è chiamato mascheramento audio. Ci sono abbastanza informazioni audio ad altre frequenze per distrarti dall'udire ciò che viene rimosso.

Riesci a sentire la differenza?

Decine, anzi centinaia, di test hanno confrontato file MP3 con tracce audio di qualità CD completa. Ci sono differenze? Ci sono sicuramente. Una cosa è diventata evidente durante la nostra ricerca:il modo in cui viene creato un file MP3 è fondamentale per la sua qualità sonora soggettiva. Codificatori diversi funzionano in modi diversi con risultati diversi.

Forse il modo migliore per descrivere la differenza tra una registrazione di qualità CD e un file MP3 è guardare la differenza tra i due. Vorrei che potessimo condividere alcuni campioni qui da farvi ascoltare, ma ciò violerebbe le leggi sul copyright. Quello che possiamo fare è mostrarti visivamente la differenza.

Abbiamo preso un campione di 3 secondi da "Give Life Back to Music" dei Daft Punk. Abbiamo scelto questa traccia per lo sforzo chiaro e consapevole dei Daft Punk di rendere disponibile in commercio una versione ad alta risoluzione dell'album. Vogliamo ringraziarli per questo! Il campione è compreso tra 31,5 secondi e 34,5 secondi nell'inizio del brano.

Questo spettrogramma mostra il contenuto di frequenza del campione. La scala orizzontale è il tempo. La scala verticale è la frequenza. Infine, l'intensità del colore mostra l'ampiezza.

Puoi vedere che c'è un contenuto di frequenza fino a 30 kHz, dimostrando chiaramente la natura ad alta risoluzione di questa traccia. Ogni banda di colore verticale rappresenta un ritmo di drum machine, più o meno.

Analisi file MP3 da 128 kb

È chiaro che le informazioni audio superiori a 16 kHz sono state rimosse. Anche il contenuto della frequenza infrasonica è chiaramente diverso. Ci sono più informazioni nel file MP3 al di sotto di 30 Hz rispetto all'originale. Questo aumento delle informazioni, tuttavia, si presenterà come una gamma meno dinamica.

MP3 vs file originale

Abbiamo invertito il file MP3 e lo abbiamo aggiunto al campione originale per creare l'immagine che vedi qui. Il risultato netto è la differenza tra le due tracce. Puoi vedere il contenuto ad alta frequenza che è stato rimosso sopra i 16 kHz. In effetti, le informazioni sono state rimosse a tutte le frequenze e tali informazioni seguono il modello di intensità del file audio.

Il file originale ha un'ampiezza di picco di -0,1 dB per entrambi i canali e un'ampiezza media di circa -14,2 dB. Le informazioni rimosse hanno un livello di picco di -10,9 dB e un'ampiezza media di -37,01. Le informazioni rimosse sono sepolte in profondità al di sotto delle informazioni sull'ampiezza di picco.

Come suona l'audio rimosso? Descriveremmo la clip come il suono di una banda musicale lontana. L'audio è per lo più informazioni ad alta frequenza. Anche la traccia ha una consistenza decisamente gorgheggiata:i ritmi della drum machine sono chiari e presenti, ma suonano come colpi di piatti distorti.

Anche con un preamplificatore per cuffie di fascia alta e cuffie da studio, la differenza è difficile da percepire quando si passa dalla traccia originale al file MP3. In un ambiente di ascolto con una scena sonora più ampia, potrebbe essere più evidente.

Conclusioni sui file MP3

I puristi ti diranno che dovresti avere registrazioni della massima qualità disponibile. Non c'è nessuna colpa in questa logica. Perché lesinare quando puoi avere tutto? I file MP3 ad alto bitrate, come quelli a 320 kbps, ad esempio, sono di qualità eccellente. Test ripetuti hanno dimostrato che, se creati con algoritmi di compressione di qualità, la differenza sonora tra una registrazione di qualità CD e un file MP3 a 320 kbps è quasi impossibile da rilevare. I file MP3 con bitrate inferiore iniziano a smaltire più informazioni e le differenze aumentano.

Le ultime unità sorgente sul mercato sono in grado di riprodurre file audio WAV e FLAC di grande risoluzione e profondità di bit. A breve, vedremo unità che riprodurranno file MQA su connessioni digitali. Quasi tutte le sorgenti gestiranno file MP3 e WMA.

Entra oggi stesso nel tuo rivenditore specializzato di elettronica mobile locale e porta con te della musica da ascoltare. Pensiamo che rimarrai colpito, indipendentemente dal formato che scegli.


  1. Che cosa è un ALX sul file
  2. Che cosa è un Transformer Audio
  3. Che cosa è la riproduzione di CD MP3 in Stereo
  4. Che cosa è un SACD
  5. Che cos'è un file CDA Audio
  6. Che cosa è un Optical Audio Connector