Vous Etes ici: techniques / la chaine de production / traitements / codecs

 

 

 

 

 

encodages et decodages AUDIO

 

Réduction de bruit, réduction de volume, réduction de débit...réduction de qualité ?

 

Cette page a vocation de recenser les formats sonores numériques et les procédés de COdage-DECodage, utilisés dans l'univers du son (professionnel, home-cinema, hifi...). La liste est incomplète et ne manquera pas de s'enrichir avec le temps...

 

 

AAC, Audio Advanced Coding

C'est un format de compression de données audio développé par l'institut Fraunhofer en partenariat avec AT&T, Nokia, Sony et Dolby. Comme dans le cas du format MP3, il s'agit d'une compression par destruction de données audio, dite «compression avec pertes» ("lossy compression" en anglais), éliminant des informations auditives afin d'obtenir le meilleur taux de compression possible, tout en gardant un résultat qui soit le plus proche possible des données originales. Le format AAC a ainsi été choisi comme principal format de fichier par la société Apple dans les iPod ou dans son logiciel iTunes. Il utilise un encodage dit à débit variable (en anglais Variable Bitrate, VBR) qui permet d'adapter le nombre de bits utilisés par seconde pour encoder les données audio à la complexité du flux à un instant donné. L'algorithme utilisé est plus performant que celui du MP3. Comparé au deux canaux maximum (en stéréo) supportés par le format MP3, le format AAC permet un enregistrement polyphonique jusqu'à 48 canaux et permet de plus une restitution sonore dans la bande de fréquences 8Hz-96.0kHz, contre 16 à 48 kHz pour le format mp3. Les fichiers AAC sont globalement plus petits que les fichiers au format MP3.

Le format AAC n'est pas compatible avec le format MP3. Il est donc nécessaire d'utiliser un lecteur supportant le format ou installer un codec spécifique. Néanmoins, de plus en plus de lecteurs logiciels permettent de lire des fichiers dans ce format et la plupart des lecteurs MP3 récents le supportent.

 

AC-3, Audio Coding 3 (codage audio de 3ème génération).

Technique de codage spécifique à l'audio développée par "Dolby Laboratories" pour le stockage et la transmission d'un ou plusieurs canaux audio. Cette technique de codage a pour objet la diminution du nombre d'octets nécessaires à la reproduction d'un signal sonore sans perte subjective de qualité pour sa restitution. L'AC3 est cependant plus connu sous le nom de Dolby Digital dont le standard de codage numérique est le 5.1.

 

ADPCM, Adaptive Differential Pulse Coded Modulation.

Codage différentiel et adaptif du codage PCM. Contrairement au PCM qui code chaque échantillon indépendamment de l'échantillon précédent, l'ADPCM stocke les différences de valeurs entre deux échantillons PCM adjacents et émet certaines hypothèses qui permettent une réduction des données. En raison de ces hypothèses, les basses fréquences sont reproduites correctement, mais les hautes fréquences ont tendance à être déformées. La distorsion, facilement audible dans les fichiers ADPCM 11 kHz, devient plus difficile voire impossible à discerner à mesure que les taux d'échantillonnage deviennent plus élevés. (fichiers wav)

 

AIFF, Audio Interchange File Format

Format de fichier audionumérique non compressé développé par Apple pour stocker les sons sur les ordinateurs de la marque. Il existe néanmoins un format compressé (AIFF-C ou AIFC) qui supporte une compression pouvant aller jusqu'à un rapport 1/6.

 

ATRAC, Adaptive TRansform Acoustic Coding.

Technologie de compression du son utilisée sur le MiniDisc. L’ATRAC prend en compte les effets psycho-acoustiques et notamment l’effet de masque en ne reproduisant que ce que l'oreille est censée percevoir dans l'image sonore de la musique. Le format sonore SDDS de Sony utilise aussi l'ATRAC.

 

Apple Lossless, (Apple Lossless Audio Codec (ALAC))

Codec audio développé par Apple pour une compression audio-numérique sans pertes. ALAC est stocké dans un conteneur mp4 mais si le conteneur est identique, le codage est différent. Il ne s'agit pas d'une variante de l'AAC, de type avec pertes, mais bien d'un format distinct qui utilise la prédiction linéaire, comparable aux autres codecs sans pertes (lossless en anglais) tels FLAC ou SHORTEN qui ne sont pas supportés par iTunes. Tous les iDevices peuvent lire des fichiers ALAC.

 

Dbx

Créé en 1971, plus "populaire" dix ans plus tard, les types I et II n'ont pas réussi à rivaliser avec leur concurrent Dolby (voir plus bas,) malgré leur efficacité, notamment pour les enregistrements sur bande magnétique à moyenne vitesse, à cause de l'incompatibilité entre systèmes et une tendance à l'effet de "pompage" audible, car l'action se situe sur l'ensemble du spectre (30Hz à 15kHz...). Pire, malgré un taux de compression expansion de deux sur un, les deux types de Dbx ne sont pas non plus compatibles entre eux, d'où le ressentiment du public...

Mais tout n'est pas négatif : des disques vinyles (environ 1100 albums) ont été réalisés avec Dbx II entre 1973 et 1982, avec une quasi disparition des bruits de poussière et de surface à la clé, pour une dynamique théorique de...120dB (loin des 45 dB moyens, alors la norme).

 

 

DNL, Dynamic Noise Limiter

Introduit en 1971, il s'agit d'un circuit notamment utilisé par Philips dans les magnétophones à cassette de la marque. Le principe de fonctionnement en est simple et ne nécessite pas d'encodage préalable (il n'agit qu'en lecture) d'où sa compatibilité. C'est seulement lors de passages calmes que le bruit de la bande devient gênant. En réduisant le gain pour les fréquences plus élevées au cours de ces périodes, l'amélioration du rapport signal-sur-bruit est significative. Ceci n'a qu'un effet mineur sur les composantes de haute fréquence du signal puisque celles-ci sont efficacement masqués par le bruit de toute façon. L'effet est progressif avec une atténuation des hautes fréquences à mesure que le niveau de signal chute.

 

Dolby et la réduction du bruit de fond

 

Dolby A

En 1966, Ray Dolby met sur le marché le premier appareil de réduction de bruit professionnel connu comme Dolby NR-A (Noise Reductor). Ce système est réservé aux studio professionnels de musique avant d'être étendu et adapté pour la projection en salles de cinéma, en 1972.

 

Dolby B

Pour pouvoir éviter le bruit (souffle) des bandes et cassettes, le principe adopté est de traiter les passages à bas niveau en procèdant en deux étapes. La première consiste à remonter le niveau de ces passages à l'enregistrement puis de procéder à l'inverse de la lecture dans un deuxième temps. Dans les procédés Dolby de réduction du bruit on trouve deux règles essentielles:

La première est qu'il ne faut pas intervenir aux niveaux suffisamment forts car ils masquent eux mêmes le bruit;

La seconde est qu'il faut s'adapter au signal à traiter en regard de son étendue, c'est pourquoi le système emploie une bande de compression-expansion (et une seule, à l'opposé de son grand frère A qui en met quatre en oeuvre) avec glissement de fréquences. Dit simplement, il s'agit d'un filtre dont la fréquence d''action peut varier entre 300Hz et 20000Hz avec une amplitude d'action d'une dizaine de dB.

 

Dolby C

Afin de faire mieux que la version B, les laboratoires Dolby mettent au point un système à deux bandes d'action avec fréquence glissante, démarrant plus bas dans le spectre, avec une efficacité différente au fur et à mesure de la montée fréquentielle, mais aussi un seuil de déclenchement de l'action différent. En résumé, une amplitude d'action jusqu'à 20 dB au plus dans une bande s'étirant à partir de 100Hz.

 

courbes dolby bet c

Corrections du dolby B (courbe en bas) et du type C (courbe du dessus), à l'encodage

 

Dolby S

Dérivé du Dolby SR (spectral recording, pour le cinéma), sorti en 1986, il marque l'apogée du traitement de filtre analogique pour la société.

 

Dolby Surround (2+1)

Procédé technique d'amélioration de la reproduction sonore développé par les laboratoires Dolby. Le Dolby Surround consiste à reproduire le son sur 3 canaux à partir d'une source stéréophonique 2 canaux. On obtient le canal supplémentaire dit surround apres matriçage et filtrage de ces 2 canaux. Le canal arrière surround est monophonique et se trouve volontairement limité dans une bande de fréquences comprises entre 100 et 7000Hz.

 

Dolby Surround Prologic (2+1+1)

Procédé de décodage amélioré pour le Dolby Surround. Inventé dans les années 40, ce systême comprend quatre voies distinctes, la plus importante étant la voie centrale monophonique, chargée de diffuser les dialogues et presque tout le reste de la bande son. A l'origine, le Dolby séparait les canaux de 7 dB seulement grâce à une matrice de décodage rudimentaire, contre 30 à 40 dB actuellement au moyen de puces spécifiques. Rebaptisé Dolby Surround Prologic en 1987, ce format fut un succès par l'intermédiaire du laserdisc: video analogique et son numérique PCM matricé sur 2 canaux en LTRT (Left Total, Right Total) compatible mono et stéréo. C'est ce type de signal que les chaines de télévision équipées du Nicam diffusent ("Near Instantaneous Companded Audio Multiplex", Multiplexage audio à compression quasi-instantanée qui permet la transmission d’un son numérique stéréo en complément d'un signal de télévision analogique). Ce système multicanal est le plus connu et le plus répandu dans le monde. Il dispose donc d'une voie centrale, une gauche, une droite et un effet arrière de surround en mono. L'extrême-grave, orienté vers un caisson spécialisé, est extrait des quatre voies par filtrage et sommation, il ne s'agit donc pas d'un canal distinct.

 

Dolby Surround Prologic II

Le Dolby Pro Logic 2 a pour vocation première de simuler un environement 5.1 à partir de toutes sources stéréo encodées ou non en Dolby Surround. Le DPL2 convient tout aussi bien à l'écoute des pistes sonores cinéma qu'à celle d'oeuvres musicales stéréophoniques. Le DPL2 est donc pourvu de deux modes bien distincts: le mode Movie et le mode Music.

En mode Movie, le décodage reste identique dans l'esprit à celui appliqué par son prédécesseur, mais diffère aux niveaux des technologies employées et des performances. Les canaux surround, précédemment monophoniques, sont désormais traités indépendamment par le processeur émulant ainsi des effets stéréophoniques sur les voies arrière. D'autre part, grace à une meilleure séparation des voies avant-arrière, la limitation de la bande passante à 7kHz en surround n'a plus de raison d'être. Le DPL2 n'applique par conséquent aucun filtre aux extrémités du spectre. Enfin, Le DPL2 autorise la redirection des basses fréquences vers le subwoofer.

En mode Music, le décodeur permet d'ajuster à sa guise trois réglages optionnels. Ces trois réglages ont pour objectif de pallier certaines déconvenues qui pourraient se manifester lors de l'écoute de programmes non prévus pour ce mode. Le premier réglage nommé "Dimension Control" permet d'ajuster plus précisément l'équilibre du champ sonore entre les voies frontales et les voies arrière. Le second mode "Center Width Control" permet comme son nom l'indique le réglage de la voie centrale. Enfin le "Panorama Mode" permet de reporter à l'identique les informations des voies frontales sur les voies arrières.

 

Dolby Surround Prologic IIx

Evolution du Dolby Prologic II, il transforme n'importe quel signal stéréo ou 5.1 en un signal 6.1 et 7.1. Il est possible de choisir un mode pour les films (movie mode) et la musique (music mode). Tout comme avec le Prologic II, le mode musique inclut aussi les options suivantes : Dolby Center Width, Dolby Panorama et Dolby Dimension. Le Pro Logic IIx incorpore également un mode pour les jeux (game mode).

 

Dolby et le numérique

 

Dolby Digital

Anciennement appelé AC-3 dans le grand public et SR-D au cinema, le Dolby Digital encode et décode en numérique les canaux centre, gauche, droit, surround gauche, surround droit et extrême-grave. Le taux de compression atteint 12:1, soit un débit de 384 kbps, sur 16 bits à 48 kHz d'échantillonnage. Ce procédé bénéficie donc de cinq canaux identiques, fonctionnant en large bande: 20 Hz à 20 kHz, contrairement au Dolby analogique qui limite la bande passante du surround de 100 Hz à 7 kHz. La voie grave devient un canal discret à part entière, ajoutant à la bande son des films une dimension dramatique supplémentaire. Développé pour le cinema en 1991, le Dolby Digital fait son apparition sur le laserdisc, puis sur le DVD video, ce qui a nécéssité l'achat de décodeurs spécifiques, mais toujours dotés d'une compatibilité descendante: mode mono, deux voies (mixdown) ou émulation de Dolby Surround Prologic, en passant par une voie centrale fantôme (diffusée par les deux voies avant latérales).

Pour résumer on parle de Dolby Digital 5.1 lorque le flux numérique contient les cinq canaux large bande et le signal destiné au caisson de grave (représenté par le "1"). Mais le Dolby Digital 1.0 existe aussi, il s'agit alors d'un simple son monaural.

 

Dolby Digital Surround EX

En 1998, les laboratoires Dolby en collaboration avec THX, annoncent la mise au point du Dolby Digital Surround Ex, pour Extended (surround étendu). Il est utilisé pour la première fois au cinéma à l'occasion de la sortie du film Star Wars Episode 1. Il s'agit tout simplement d'une amélioration du Dolby Digital 5.1 par le biais du décodage Prologic. En effet, un canal surround central vient faire son apparition. Ce nouveau canal est en fait matricé sur les canaux surround gauche et droit. Dès lors, il n'y a qu'à appliquer le décodage prologic sur les deux voies surround d'une piste 5.1 EX pour que le message du canal surround central soit restitué. Cependant, le surround EX ne constitue en aucun cas un véritable son 6.1 discret (le nombre de canaux dans la bande son est de 5+1).

 

Dolby Digital Plus (DD+)

Il s'agit d'une évolution du format Dolby Digital. Il est censé offrir une meilleure qualité audio, un plus grand nombre de canaux ainsi qu'une plus grande flexibilité:

- Flux multi canaux pouvant contenir jusqu'à 7.1 canaux discret et au delà pour un débit maximum de 6Mbps.

- Plusieurs programmes audio peuvent être véhiculés au sein d'un seul flux Dolby Digital Plus.

- Compatibilité en sortie avec un décodeur Dolby Digital ordinaire.

- Le débit pourra varier : 3Mbps pour le HD DVD, 1.7Mbps pour le Blu-Ray Disc.

- Maintien d'un débit supérieur à 320kbps pour les systèmes broadcast.

- Supporté par la connection HDMI.

 

Dolby TrueHD (DTHD)

Le Dolby TrueHD est la version lossless du Dolby Digital et par conséquent aussi le concurrent direct du DTS HD.

Le Dolby TrueHD propose:

- Un débit pouvant aller jusqu'à 18Mbps

- Un support d'au moins 8 canaux pleine bande d'une résolution 24bits / 96kHz.

Théoriquement le nombre de canaux gérés par le Dolby TrueHD peut être supérieur à 8 mais c'est ce nombre qui a été retenu par les nouveaux standards haute définition que sont le DVD-HD et le Blu-Ray Disc.

- Support et transport du flux par interface HDMI.

- Un support d'informations additionnelles comme la normalisation des dialogues (Dialogue Normalization) ou le contrôle de la dynamique (Dynamic Range Control).

Le Dolby TrueHD assure une compatiblité avec les décodeurs Dolby Digital actuels.

 

DPCM, Differential Pulse Code Modulation.

Codage numérique différentiel. En français on parle de modulation par implusion codées différentielles, MICD. Il s'agit de la possibilité de coder l'échantillon courant en ne prenant en compte que la différence par rapport à l'échantillon précédent. Si le codage s'adapte à l'information à traiter, il devient ADPCM, ce qui permet de réduire le nombre de bits affectés à chaque échantillon.

 

DSD, Direct Stream Digital.

Nouveau format d'encodage développé par Sony et Philips utilisé notamment sur le SACD (Super Audio CD). La technologie DSD est basée sur une méthode de numérisation appelée Pulse Width Modulation (PWM), un codage prônant la simplicité du phrasé numérique compensé par une très haute fréquence d'échantillonnage. En travaillant 64 fois plus vite que dans le cas du CD-audio les relevés de tension sont à ce point nombreux et rapprochés les uns des autres que la séparation des échantillons est très faible. La méthode Delta Sigma employée permet d'encoder sur un bit le fait que le signal augmente ou décroit. Un échantillon représente la différence entre le signal à cet instant et celui à l’instant précédent. L'autre point fort du DSD réside dans sa flexibilité puisqu'il reste possible de le convertir sous forme PCM en vue de l'élaboration d'un CD ou d'un DVD. Le procédé de conversion DSD/PCM est appelé Super Bit Mapping Direct.

 

DTS HD, Digital Theater System (DTS HD)

Conçu par les studios Universal, le DTS se pose en concurrent du Dolby Digital, avec qui il partage quelques points communs. En effet, le DTS est aussi un format sonore capable de contenir cinq canaux pleine bande et un canal destiné à l'extrême grave. Il possède son propre logiciel de compression de données, différent de celui du Dolby Digital: l'AC-3. Le taux de réduction de débit peut être fixe ou variable en fonction de la complexité du message sonore. Cette souplesse d'exploitation est la moindre des qualités du DTS qui s'adresse à de nombreux supports, allant des systêmes de diffusion des salles de cinéma au multimédia en passant par le home-cinema avec les LD et DVD, et même les CD audio encodés en 5.1.

Le DTS prend donc des formes multiples: il accepte une résolution jusqu'à 24 bits, toutes fréquences d'échantillonnage comprises entre 8 kHz (pour le multimédia) et 192 kHz (pour les prochaines versions du DVD). Un peu décrié par ses détracteurs habitués à l'exploitation du Dolby Digital en salle, le son DTS nécessite un lecteur de disque optique synchronisé au film, contrairement au Dolby Digital directement placé entre les perforations de la pellicule. En revanche, lorsque le film accompagné de sa bande sonore est gravé sur un disque destiné au home-cinéma comme pour les LD ou DVD, il n'y a plus de risque de désynchronisation. Dans ce domaine précis, le DTS n'a rien à envier au Dolby Digital, car lui aussi peut présenter en sortie du lecteur un son compatible mono ou matricé LtRt (Left Total, Right Total) servant au décodage Prologic, tombé dans le domaine public. Le DTS compresse quatre fois moins les données que le Dolby Digital (3 fois contre 12 fois), sa finesse et sa dynamique (20 bits) sont également supérieures.

 

DTS 24/96

Evolution du format DTS ordinaire contenu sur les DVD audio ou vidéo, (24 pour 24 bits de quantification et 96 pour 96kHz de fréquence d'échantillonnage) cette extension conserve une pleine compatibilité avec le matériel DTS existant donné pour 20bits et 48kHz. Les informations supplémentaires ne seront tout simplement pas lues. Le format DTS 24/96 est principalement destiné aux enregistrements audio des DVD-Audio et se veut le concurrent direct du MLP 5.1 24/96 présent aussi sur ce support.

 

DTS ES

Le DTS ES, (ES pour Extended Surround) est un format sonore développé par Digital Theatre Systems, qui fait intervenir un canal d'effet arrière central "surround back" en plus des cinq canaux habituels du flux DTS 5.1. En fait, il s'agit du même traitement que pour le Dolby Surround EX car ce nouveau canal surround est issu du dématriçage des voies arrières gauche et droite.

 

DTS ES 6.1 Discrete

Dernier né des formats DTS, et tout comme le DTS ES, il fait également apparaitre une voie arrière nommée "surround back" supplémentaire. Par contre, contrairement au systême matricé du DTS ES, ce canal supplémentaire n'est pas combiné (matricé) à d'autres voies, mais se présente sous la forme d'un canal supplémentaire réel (ou discret) à part entière. Le signal est encodé sous un format 6.1 réel et non 5.1 avec sixième canal matricé. Notons que ce nouveau son DTS est entièrement compatible avec un équipement DTS 5.1 car les informations concernant ce nouveau canal sont contenues dans le flux DTS 5.1 et restera invisible pour un équipement non prévu à cet effet.

 

DTS-HD Master Audio

L'arrivée des nouveaux supports optiques haute densité que sont le DVD-HD et le Blu-Ray Disc est aussi l'occasion de l'émergence de nouvelles normes pour le son numérique multi-canaux en haute définition. Le DTS-HDMA se veut un ensemble d'évolutions apportées au codec audio "Coherent Acoustics" qui comprend déjà les formats DTS Digital Surround, le DTS ES ainsi que le DTS 24/96. Le concurrent direct du DTS-HDMA est le Dolby TrueHD. Le DTS-HDMA peut théoriquement supporter une infinité de canaux qui peuvent être réduits en 5.1 ou en simple stéréo 2 canaux. Il en va de même pour le taux de compression qui peut varier du taux de compression du DTS ordinaire à un taux de compression nul et par conséquent sans perte. Le DTS HD, comme bien des variantes du codec DTS, propose une compatibilité ascendante afin de garantir une compatibilité avec les décodeurs DTS ordinaire.

 

DTS-HD High Resolution Audio

Le DTS-HD High Resolution Audio se veut une évolution du DTS destiné aux supports optiques haute définition que sont les Blu-Ray disc et HD-DVD. Il peut contenir jusqu'à 7.1 canaux Le signal demeure compressé et par conséquent offre une qualité légèrement inférieur au DTS-HD Master Audio.

 

DTS Neo

Nouveau format créé par les laboratoires DTS, il redistribue, sur six canaux, les deux voies d'un enregistrement stéréophonique. Le DTS Neo existe sous deux formes, "Music" et "Cinema", qui correspondent à deux modes différents de traitement sonore.

En DTS Neo Cinema, les signaux parfaitement en phase entre les deux cannux sont restitués par la voie centrale. Les signaux en opposition de phase sont dirigés vers les voies surround, tandis que le reste du signal est restitué par les voies principales avant gauche et droite. Ce traitement s'apparente beaucoup au décodage du Dolby Surround Prologic.

En mode DTS Neo Music, les deux voies principales restituent la totalité du signal stéréophonique, sans modification, afin de respecter intégralement la qualité sonore de l'enregistrement. Pour créer une sensation d'espace, les informations déphasées sont dirigées vers les canaux arrières et la voie centrale.

 

FLAC, Free Lossless Audio Codec

FLAC a pour principal avantage de réduire le débit ou la capacité de stockage nécessaire sans perdre d’informations de la source audio. Un enregistrement numérique (tel qu’un CD) codé en FLAC peut être décompressé pour obtenir une copie identique des données audio. Coder en FLAC peut permettre une réduction de taille de 30 à 70 %. La réduction de taille est dépendante de la source : plus le signal est constitué de sons naturels, meilleure est la compression. Par contre, un signal aléatoire (du genre bruit) ne se compresse pas très bien. Ce phénomène est valable pour tous les formats de compression sans perte. FLAC est approprié pour tous les archivages de données audio, avec le support des métadonnées, image de couverture, ainsi que pour la recherche rapide. FLAC est bien supporté par de nombreux logiciels.

 

LPCM, Linear pulse code modulation

Format audio multicanal haute définition, non compressé, norme de la plus haute qualité. Il peut contenir jusqu'à 8 canaux.

 

MPEG-1 AUDIO

Les normes MPEG audio définissent trois couches (layers) de codage, qui diffèrent par leur taux de compression pour une qualité audio perçue donnée.

Les quatre modes de transmission principaux sont:

-stereo: les voies G et D sont codées de manieres indépendante.

-joint-stereo: exploitation de la redondance entre les voies G et D afin de réduire le débit.

-dual-channel: deux voies son indépendantes, par exemple le son bilingue.

-mono: une seule voie son.

 

MPEG-2 AUDIO

La norme MPEG-2 audio reprend l'essentiel de la norme MPEG-1 et prévoit une possibilité d'extension multicanal permettant la transmission de son à voies multiples tout en restant compatible avec le mode stéréo MPEG-1 de base. Le MPEG multicanaux fut cependant abandonné pour le support DVD de la zone Europe au profit du Dolby Digital.

 

MP3

L'objectif est d'oublier les composantes inaudibles pour gagner de l’espace:

Voici les principales étapes d’un codeur MPEG I/II niveau 3 (“MP3”) :

1. Analyse spectrale (Fourier)

2. Modèle psychoacoustique : calcul du masque

3. En fonction du rapport signal/masque (SMR), quantifier l’amplitude des composantes spectrales sur un nombre de bits différent exemple : SMR = 10 dB: 16 bits . . . SMR < 0 dB: 0 bits

4. Codage entropique, sans perte.

Ainsi que défini par le dictionnaire Larousse: "Dans la théorie de la communication, l'entropie est un nombre qui mesure l'incertitude de la nature d'un message donné à partir de celui qui le précède. (L'entropie est nulle lorsqu'il n'existe pas d'incertitude.)"

 

" Pour rendre la musique MP3 moins lourde (taille du fichier informatique binaire), on la comprime. Le principe est de retirer les sons qui ne sont pas audibles par l’oreille humaine, comme les ultrasons (aigus) ou les infrasons (graves). Mais attention cette musique «allégée» (12 fois moins lourde que la musique en format standard) doit rester «de bonne qualité», pour satisfaire les auditeurs. "

 

Pour cela, le MP3 ne code pas toutes les données nécessaires à la restitution complète du son, mais uniquement celles que l’oreille perçoit. Ceci se passe en trois étapes.

 

1ère étape : Tous les sons qui ne sont pas perçus par l’oreille seront tout simplement supprimés. La compression permet en effet d’analyser les composantes spectrométriques d'un signal audio et de leur appliquer un modèle psychoacoustique pour ne conserver que les sons « audibles ». Il s'agit donc d'une compression destructive, c'est-à-dire avec une perte d'information.

2ème étape : On codera ensuite avec plus de précision les sons auxquels l’oreille est la plus sensible (ceux entre 2 et 5 kiloHertz). Le reste des sons, dont les fréquences sont moins bien perçues par l’oreille, seront codés avec moins de précision. Ils seront alors de moins bonne qualité mais, et c’est là l’objectif, beaucoup moins lourds (en termes de taille de fichier informatique ou volume de données à transférer). L’auditeur ne remarque pas cette «dégradation» du son d’origine car elle concerne des fréquences auxquelles l’oreille n’est pas sensible.

Durant cette même phase, on rajoute un deuxième traitement : la compression dynamique. Elle consiste à relever les niveaux faibles et abaisser les niveaux forts, en gommant la dynamique, c'est-à-dire en réduisant fortement les écarts entre sons faibles et forts. Ces deux étapes vont rendre la musique moins lourde sans (apparemment?) changer la perception du son.

3ème étape : Le MP3 va aller plus loin en exploitant le phénomène du masquage: Quand un son atteint une certaine intensité, il masque les sons de plus faibles intensités qui sont les plus proches de lui. Le MP3 va donc éliminer ces sons dits « masqués ».

 

 

MUSEPACK, MPC

C'est un algorithme libre de compression audio avec pertes. Musepack est conçu pour produire un encodage dit « transparent » (indifférenciable du fichier original) . La compression et la décompression du Musepack s'effectuent très rapidement. Les exécutables sont particulièrement véloces

 

MUSICAM, Masking Universal Subband Integrated Coding And Multiplexing

Ce procédé de codage spécifié par MPEG-1 audio, couche 2 et utilisé par les systêmes radio DAB et télévision DVB.

 

OGG Vorbis

Comme le MP3, Vorbis est un format de compression avec pertes. Il utilise des techniques similaires au format JPEG pour les images. Les outils de codage exploités sont plus avancés que ceux qu'exploite le MP3, qui paie ici son ancienneté. Cela explique des performances supérieures. Vorbis utilise par défaut la compression VBR. Ainsi, c'est la qualité sonore qui est constante (en théorie) et non pas le débit de données, sauf dans certains cas de streaming sur internet qui peut avoir des exigences de régularité du débit. Vorbis étant le contenu et OGG le contenant, (Matroska, conteneur vidéo, peut servir de contenant alternatif). Ogg Vorbis est donc le format audio Vorbis encapsulé dans le contenant Ogg.

 

OPUS

A l'origine "Harmony" c'est un format ouvert de compression audio avec pertes, libre de redevances, développé par l'Internet Engineering Task Force (IETF, voir bas de page) dans le but d'être utilisé par des applications interactives sur Internet. Opus est la proposition en format standard, acceptée dans la compétition codec de l'IETF pour un "nouvel Internet à large bande audio", actuellement en développement.

Ce codec utilise deux algorithmes, celui utilisé dans SILK (créé par Skype, plus orienté sur la voix humaine) et celui utilisé dans CELT (créé par la fondation Xiph.org ) plus orienté sur la musique. Opus choisit le plus adapté en fonction de la bande passante et du son qu'il doit transmettre. Il peut utiliser les deux de manière simultanée en utilisant soit la prédiction linéaire, soit la transformation en cosinus discrète pour encoder le flux audio. Selon ses concepteurs, ce codec est très adapté à Internet, où la question de la bande passante est cruciale, notamment pour les téléphones mobiles ou les utilisateurs ayant un faible débit de connexion.

 

PASC, Precision Adaptive Subband Coding

Algorithme de compression sonore développé par Philips pour sa cassette audio numérique DCC. Le PASC est aussi utilisé pour le codage MPEG-1 audio couche 1.

 

PCM, Pulse Code Modulation

C'est le principe de transmission d'un signal numérique sous la forme de modulations d'impulsions. Ce codage est utilisé notamment pour la transmission et l'enregistrement de signaux audio. Sur un CD audio le son est codé PCM échantillonné à 44.1 kHz sous 16 bits de quantification.

 

SDDS, Sony Dynamic Digital Sound

Sony, achète la Columbia-Tristar et réutilise l'ATRAC pour l'adapter au cinéma. Le SDDS diffuse sur huit canaux par l'adjonction de deux voies supplémentaires sur l'avant, ce qui porte le nombre d'enceintes frontales à cinq. Ce standard, exclusivement professionnel, est enregistré sur la pellicule du film, sur deux pistes situées à l'extérieur des perforations. Ce support peut gérer de deux à huit canaux.

 

SPEEX

À la différence de la plupart des autres codecs dédiés à la parole, Speex n'est pas fait pour une utilisation sur téléphone portable mais plutôt pour la Voix sur Iinternet et la compression dans des fichiers. Il fallait un codec optimisé pour la parole associant une bonne compréhension du dialogue transmis, ainsi qu'un fort taux de compression des données possibles. Speex peut utiliser de nombreux débits et bande passante possibles.

 

THX

THX Limited (THX Ltd.) N'EST NI UN SYSTEME DE CODAGE NI UNE NORME et ne trouve sa place ici que pour cette précision...Il s'agit en fait d'un standard de reproduction pour la haute-fidélité, l'audiovisuel, le home-cinéma, les salles de projection, les consoles de jeux.., créé par un ingénieur du son travaillant avec Georges Lucas. THX représente principalement une assurance-qualité...

 

WAV, Wave

Format audio sans compression mis au point par Microsoft et IBM

 

WMA, Windows Media Audio

Format de compression de données audio avec pertes, développé par Microsoft. Il permet en outre de protéger l'encodage contre les copies illégales.

 

WMA Pro, Windows Media Audio Profesionnel

Format audio multicanaux 5.1 ou 7.1 développé par Microsoft. Son mode d'encodage peut aussi être à débit variable (VBR). Le WMA Pro existe aussi dans une version lossless afin de respecter au maximum le master son initial. Ce mode se veut être un concurrent des autres modes de compression lossless comme le MLP (DVD-Audio), Monkey, LPAC... En mode WMA-lossless, la compression de données est d'environ 2:1.

 

haut de page

 

L’Internet Engineering Task Force, abrégée IETF« Détachement d'ingénierie d'Internet » est un groupe informel, international, ouvert à tout individu, qui participe à l'élaboration de standards Internet. L'IETF produit la plupart des nouveaux standards d'Internet.

 

Les DRM Digital Rights Management correspondent aux droits d'utilisation (Copyright). sur les supports numériques

 

 

 

 

 

 

 

 

logo-flac

 

contact@soundovr.com Qui sommes-nous? ©Copyright MD 2013-2014