In che modo il formato audio MP3 riduce la dimensione dei dati?
1. Modello psicoacustico: Questo è il nucleo della compressione MP3. Si basa su come l'orecchio umano percepisce. L'encoder analizza il segnale audio e identifica frequenze e suoni che potrebbero essere mascherati da suoni più forti o sono meno percepibili al nostro udito. Queste frequenze mascherate vengono quindi fortemente compresse o scartate. Ad esempio, un suono tranquillo ad alta frequenza suonato contemporaneamente con un forte suono a bassa frequenza potrebbe essere completamente impercettibile, quindi viene rimosso.
2. Trasformazione di frequenza: Il segnale audio viene trasformato dal dominio del tempo (ampiezza nel tempo) nel dominio di frequenza (ampiezza di diverse frequenze). Questo di solito viene eseguito utilizzando una trasformazione del coseno discreta modificata (MDCT). Questa rappresentazione consente un'identificazione e manipolazione più facili delle singole frequenze.
3. Quantizzazione: Dopo l'analisi della frequenza, i valori di ampiezza di ciascun componente di frequenza sono quantizzati. Ciò significa che sono arrotondati a un numero limitato di valori. Ciò introduce una certa perdita di informazioni, ma poiché le frequenze meno importanti sono state identificate e potenzialmente rimosse o pesantemente compresse, l'impatto udibile è ridotto al minimo.
4. Codice Huffman: Infine, i dati quantizzati vengono codificati utilizzando un codice a lunghezza variabile chiamato codifica Huffman. Ciò assegna codici più brevi a dati più frequenti e codici più lunghi a dati meno frequenti, portando a un'ulteriore riduzione dei dati.
In sostanza, MP3 sfrutta le imperfezioni e le limitazioni dell'udito umano per ridurre significativamente la quantità di dati necessari per rappresentare l'audio puntando a mantenere una qualità audio accettabile. Il livello di compressione (e quindi la riduzione delle dimensioni) può essere regolato, risultando in diversi file di dimensioni e livelli variabili di qualità audio. Rapporti di compressione più elevati portano a file più piccoli ma artefatti potenzialmente più evidenti o perdita di fedeltà.