IL FORMATO DI COMPRESSIONE MPREG-4

Il nuovo standard Mpeg-4 rappresenta l'evoluzione più recente della famiglia di compressori video Mpeg e adotta algoritmi più efficienti rispetto a quelli disponibili per l'Mpeg-2, principalmente grazie alle tecniche di compressione denominate Ace (Advanced Coding Efficiency), che però richiedono l'impiego di processori nel 1992 e si è arrivati al documento ufficiale verso la fine del 1999. La serie Mpeg è iniziata con l'Mpeg-1, capace di trattare video con una risoluzione di 352 x 288 pixel per i segnali video Pal e con un bit rate di 1,5 Mbit al secondo. L'applicazione commerciale più importante dell'Mpeg-1 è stata il VideoCD, che però non ha avuto grande successo in Europa, principalmente a causa dello scarso miglioramento delle immagini rispetto ai nastri Vhs.L'Mpeg-2 è stato sviluppato in seguito per consentire la diffusione di programmi televisivi digitali di qualità professionale, dapprima tramite i satelliti e in seguito per mezzo dei Dvd. Il formato delle immagini è pari a 720 x 576 pixel per i Pal e a 720 x 480 punti per l'Ntsc. Lo standard Mpeg-2 è classificato secondo una serie di profili e di livelli, che definiscono la sintassi degli algoritmi di compressione e i parametri del flusso video, come il bit rate, la risoluzione dell'immagine, il rapporto di compressione e cosi via. Allo scopo di ottenere video di qualità e di compattezza sciabili, è quindi stato sviluppato l'Mpeg-4, che riprende gran parte delle caratteristiche e delle tecnologie visive sviluppate per l'Mpeg-2, migliorabile e arricchendole con algoritmi più avanzati. La codifica Mpeg-4 si basa su una struttura a oggetti multimediali, sia audio sia videom idealmente disposti su diversi livelli in uno spazio 3D; grazie a questa organizzazione dei dati, un decodificatore adeguato consente di modificare la composizione della scena durante la riproduzione, nascondendo alcuni elementi oppure spostandoli nell'inquadratura. Ogni oggetto è suddiviso in uno o più flussi elementari, in modo da visualizzarlo a più livelli di risoluzione, una caratteristica molto importante nel caso si trasmetta il video tramite un collegamento con un'ampiezza di banda limitata.

La compattazione dei flussi video si basa su nuovi algoritmi, definiti Global Motion Compensation (Gmc), Quarter Pel Motion Compensation e Shape Adaptive Discrete Cosine Transform che consentono una compressione più efficiente rispetto a quanto avviene con l'Mpeg-1 e l'Mpeg-2. Anche Mpeg-4 supporta diverse combinazioni di profili e di livelli, in maniera molto simile a quanto accade con l'Mpeg-2; le specifiche Mpeg-4 contemplano profili per la grafica, per l'audio e per il video. Proprio come avviene con l'Mpeg-2, il campionamento di ogni singolo fotogramma si effettua suddividendo l'immagine in macro blocchi di 16 x 16 pixel, a loro volta divisi in quattro quadrati di 8 x 8 pixel. La compressione avviene cercando di raggruppare in un solo pixel - tramite l'algoritmo Sa-Dct - i punti che compongono un blocco, di fondere in un solo macro blocco i blocchi che lo costituiscono e di condensare più macro blocchi in zone di colore uniforme; queste operazioni, naturalmente, causano una perdita di dettaglio che è proporzionale al livello di compattazione che si desidera ottenere. Un' ulteriore riduzione del flusso di dati si ottiene rinunciando a metà delle informazioni relative al colore dei pixel, sfruttando il fatto che i segnali televisivi sono solitamente composti da un segnale di luminanza, che contiene i dettagli della scena, e da uno di crominanza, che trasporta le informazioni relative alle tinte. Ancora, lo standard Mpeg-4, similmente a quanto accade con l'Mpeg-2, distingue i fotogrammi secondo tre tipologie diverse: I-Frame (Intra Frame) sono i fotogrammi principali, di riferimento, che in genere si presentano ogni 12 frame per il Pal (12 fotogrammi formano un Gop, Group Of Picture, cioè un gruppo di immagini) e sono compressi unicamente con Sa-Dct. I P-Frame (Predicative Frame) sono fotogrammi compressi con Sa-Dct e con l'algoritmo Quarter Pel Motion Compensation, che confronta il frame corrente con l'I-Frame o con il P-Frame precedente, memorizzando soltanto le zone dell'immagine che sono differenti tra i due fotogrammi. Il B-Frame (Bidirectional Predictive Frame), infine, è un fotogramma compresso come il P-Frame ma prendendo come riferimenti i P-Frame precedente e successivo; in questo caso il livello di compressione è massimo. La sequenza dei vari tipi di frame in un Gop sarà quindi: I-B-B-P-B-B-P-B-B-P-B-B;  dopo l'ultimo B-Frame inizia un nuovo Gop con una struttura identica. Un'altra caratteristica fondamentale dello standard Mpeg-4 è il bit rate variabile, che consente di mantenere un flusso di dati medio abbastanza contenuto senza rinunciare alla qualità complessiva. Il bit rate cambia in funzione della complessità dei singoli fotogrammi che compongono la sequenza video: è basso se i fotogrammi sono poco dettagliati e se rappresentano una scena statica che cambia poco con il passare del tempo, mentre il flusso dei dati raggiunge il valore massimo per scene complesse e molto dinamiche.

Oltre al compressore DivX, l'applicazione più recente dell'Mpeg-4 riguarda il nuovo standard di trasmissione Umts per i cellulari, che si basa sulla tecnologia Mpeg-4 per compressione delle immagini. Inoltre, è recente la notizia che il Forum Mpeg ha stabilito di creare un gruppo di studio èer applicare il formato Mpeg-4 alla televisione ad alta definizione, memorizzando i video su un comune Dvd e ottenendo cosi una compressione di circa cinque volte maggiore rispetto agli equivalenti filmati Mpeg-2.