Les formats audios expliqués : Partie 2

Formats de numérisation du son  

CDA (Compact Disc Audio)  
Le CDA est le format des pistes des CD audio, tel qu'elles apparaissent lorsqu'elles sont insérées dans le lecteur CD-ROM. Les CD audio du commerce répondent à la norme professionnelle "Red Book". La technique d'échantillonnage du son utilisé pour les disques compacts est la modulation d'impulsion codée (en anglais PCM, pour Pulse Coded Modulation).

Pour le calcul du poids : 44100*2(2octets=16bits)*2(stéréo)*60(secondes)

Le suffixe des fichiers créés est .cda
Pour : Non comprimé, forcément qualité CD
Contre : Volumineux, Pas de gestion de Tag (certains CD sont CD text)

RAW  
RAW est un format audio utilisé pour représenter les données de son en modulation d'impulsion codée sans en-tête ni métadonnées.

WAV (Waveform Audio Vector)  
Le format WAV mono ou stéréo, mis au point par Microsoft et IBM, est l'un des plus répandus. Le format "Disque compact" 44.1 kHz, 16 bits et stéréo nous servira de référence pour le calcul du poids et ratio des autres formats.

Pour le calcul du poids : 44100*2(2octets=16bits)*2(stéréo)*60(secondes)+ en-têtes = 11 300 kilooctets/minute

Le suffixe des fichiers créés est .wav
Pour : Non comprimé (pour la version PCM)
Contre     : Pas de gestion de Tag (certains CD sont CD text), limité à 2 Go

Ogg Vorbis (ou OGG)  
Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph.org. Vorbis se différencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant dans un premier temps sur chaque paquet indépendamment des autres. Cela lui permet d'avoir très peu de faiblesses sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.

Le suffixe des fichiers créés est .ogg.

Par abus de langage, on appelle 'fichier Ogg' des fichiers musicaux compressés par l'algorithme Vorbis. Ceci peut être particulièrement dérangeant à l'ère des baladeurs numériques supportant audio et vidéo. En fait, Ogg est un conteneur qui peut contenir des pistes sonores (Vorbis), audio sans perte (FLAC), audio parlées (Speex) et vidéo (Theora). Un 'fichier Ogg' peut donc contenir l'un ou l'autre (ou une combinaison) de pistes. Pour être plus clair, nous devrions parler de fichier Ogg Vorbis lorsque nous mentionnons un fichier .ogg qui ne contient qu'une piste sonore au format Vorbis.
Pour : Comprimé, meilleure qualité que le MP3, open source, très bon pour le streaming, supporte 255 canaux
Contre : Long à l'encodage

AIFF (Audio Interchange Format File)  
L'AIFF est un format de stockage de sons sur les ordinateurs de Apple. C'est l'équivalent du format WAV dans le monde Macintosh.

Les résolutions 8, 16, 20, 24 et 32 bits (à virgule flottante) sont acceptées.

Le suffixe des fichiers créés est .aif
Pour :    Non comprimé,
Contre : Très volumineux, une variante l'AIFF-C permet de comprimer la taille jusqu'à 6x.

AAC (Advanced Audio Coding) ou MPEG-2 AAC  
L'AAC est une extension du MPEG-2 et a été amélioré en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a été reconnu fin avril 1997.

Il fait partie des successeurs du MP3.

Le suffixe des fichiers créés est .aac, .mp4, .m4a
Pour : Très bon codec destructif (mieux que MP3 et WMA),pas de trous (Gapless), mode 5.1 ou plus .
Contre : Durée d'encodage importante

Apple et l'AAC : Apple l'a choisi comme codec prévilégié, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de système de gestion des droits numériques (DRMs), Apple a développé son propre système, appelé FairPlay. Notons qu'il est lisible sur Mac et PC.

MP3 (MPEG-1 Layer III)  
Star incontestée des codecs, MP3 est l'abréviation de MPEG-1 Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les années 92-93. La couche (Layer) III est la couche la plus complexe. Elle est dédiée à des applications nécessitant des débits faibles d'où une adhésion très rapide du monde internet à ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1:10) (1:4 à 1:12). Très rapide à l'encodage. Des royalties importantes sont à payer pour exploiter la licence (juridique) MP3. Utiliser l'encodeur MP3 LAME dernière version, encodé à 130 kbit/s permet d'obtenir une qualité comparable au AAC (Advanced Audio Coding) encodé à 48 kbit/s. [1]

Le suffixe des fichiers créés est .mp3

Type de compression : constant ou variable (VRB)
Pour :    Grande compatibilité, gestion des tag ID3.
Contre : Compression destructive avec problèmes dans les aiguës, lors d'un ré-encodage on passe par un fichier .wav .

mp3PRO  
Le format mp3PRO, fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, combine l'algorithme MP3 et un système améliorant la qualité des fichiers comprimés appelé SBR pour Spectral Bandwidth Replication.

Ce format a été publié à la fin de 2001; un fichier MP3pro 64 kbit/s a le même poids qu'un fichier MP3 à 128 kbit/s pour une qualité similaire.

Le suffixe des fichiers créés est .mp3
Pour : Gain de place.
Contre : Doit obligatoirement être relu avec un lecteur mp3pro. Un fichier 64 kbit/s relu avec un mp3 classique équivaut à un fichier mp3 de 60 kbit/s (coupure à 11 kHz). Moins bon que le mp3 (coupure avant 16kHz). - 64 kbit/s, qualité moyenne due à l’écrasement des pics, moins bon que l'ACC+, le seul encodeur gratuit supportant le MP3 Pro ne code qu'en 64 kbit/s, lors d'un ré-encodage on passe par un fichier .wav . Altération définitive des fichiers codés.

VQF ou TwinVQ (Transform-domain Weighted Interleave Vector Quantization)  
Le format TwinVQ a été développé par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le même esprit que le MP3, il comprime encore plus et avec une meilleure qualité. On regrettera une durée d'encodage un peu trop longue, près de 10 fois plus lente que le MP3. De plus, arrivé bien plus tard, et distribué sous une licence très restrictive, il a eu peu d'adeptes et est plus ou moins abandonné.

Le suffixe des fichiers créés est .vqf, .vql ou .vqe

WMA (Windows Media Audio)  
Le format WMA, créé par Microsoft à partir des recommandations MPEG-4 en 1999, est utilisé par le logiciel Windows Media Player. Ce format est lié à une gestion pointue des droits d'auteurs (Gestion numérique des droits, en anglais Digital Right Management ou DRM) qui permet de définir par exemple une durée de vie limitée pour les fichiers ou d'interdire les possibilités de gravure.
• Il existe plusieurs versions du codec (wma7.1, wma9, wma pro).
• Le suffixe des fichiers créés est .wma

Pour : bonne compatibilité, gestion des tag, meilleure compression que le MP3.
Contre : Souvent illisible sur lecteurs portables, à cause de la gestion des droits et des restrictions dans le format wma.

AU  
Le format AU est assez bien répandu grâce à Unix et Linux. La fréquence d'échantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois fréquences d'échantillonnage: 8012.821 (codec entré), 22050 et 44100 hertz.
• Le suffixe des fichiers créés est .au
• Les résolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptées.

ASF Advanced Streaming Format  
ASF est un format conteneur de Microsoft servant au streaming audio et vidéo.
Contre : Conteneur propriétaire très fermé (Microsoft)

Au delà de la qualité CD  
Aujourd'hui, la norme CD a prouvé ses limites, tant au niveau de sa fréquence d'échantillonnage que dans sa définition de 16 bits. Aidé par les nouveaux supports informatiques, le son peut être numérisé en 24 bits, voire 32 bits. La fréquence quant à elle est passée à 96 ou 192 kHz. Cette avancée permet d'avoir un son plus dynamique et plus détaillé dans les transitoires donc d'être plus proche de l'oreille humaine.

Le DVD-Audio est un exemple de qualité supérieure, mais ce type de média ne semble pas attirer le grand public. Sony a également tenté d'imposer son SACD (SuperAudio CD), qui a l'avantage d'exister en version hybride: il est lisible à la fois selon la norme CD Audio classique, sur tous les lecteurs, et en SACD sur un lecteur dédié. Une fois de plus, ce format ne semble pas attirer l'attention du grand public. Le problème ne vient pas donc des solutions, mais du grand public trop conquis par les formats compressés et ne laissant pas de chance aux nouvelles solutions.

Avant la numérisation  

Les supports  
    * Disque compact
    * Digital Audio Tape
    * Minidisc
    * Digital Compact Cassette
    * Super Audio CD
    * Disque numérique polyvalent (DVD)
    * HD-DVD
    * Blu-ray Disc
    * Carte CF
    * Disque dur

Références  
   1. Å™ (en)Gabriel Bouvigne for MP3'Tech - www.mp3-tech.org, « 48 kbit/s AAC public test », June 2007