Définition Echantillonnage Filtrage et aliasing Quantification Bruit de dispersion Suréchantillonnage Mise en forme du bruit Conversion N/A Qualité sonore |
Qu'est ce qu'une conversion analogique / numérique ? Un signal audio analogique est une forme d'onde électrique continue dans le temps. Un convertisseur Analogique / Numérique traduit ce signal en séquences de nombres binaires. Le processus de conversion A/N a une incidence majeure sur la qualité finale du signal audionumérique. En effet la qualité d'un signal audio une fois converti ne peut jamais s'améliorer. Les principaux paramètres influant sur la qualité audio sont le taux d'échantillonnage et le nombre de bits par échantillon. Le convertisseur de base intégré à l'ordinateur multimédia est un convertisseur 16 bits/44,1 kHz. Le convertisseur très haut de gamme est plutôt un convertisseur 24 bits/96 kHz. Echantillonnage L'échantillonnage consiste à mesurer l'amplitude de la forme d'onde à des intervalles de temps réguliers. Echantillonnage d'un signal audio quelconque Les impulsions représentent les amplitudes instantanées du signal à chaque instant t. Les échantillons peuvent être considérés comme des images instantanées du signal audio et donnent assemblés une représentation de la formes d'onde continue. Plus le nombre d'échantillons sera grand plus, plus le signal sera représenté finement. Shannon indique que pour obtenir les informations nécessaires pour caractériser le signal, il faut prélever au moins 2 échantillons par cycles audio. Le problème d'aliasing (ou repliement de spectre) produit lors de la reconstruction du signal d'origine si le nombre d'échantillons n'est pas assez grand. Le signal reconstruit n'est pas similaire au signal initial. Le processus d'échantillonnage peut être visualisé en le considérant en termes de modulation. La forme d'onde audio continue est utilisée pour moduler une chaîne régulière d'impulsions. La fréquence de ces impulsions est la fréquence d'échantillonnage. Ce procédé est appelé Modulation d'impulsions en amplitude (PAM). Filtrage et aliasing Afin d'éviter le phénomène d'alias vu ci-dessus, il est nécéssaire de filtrer le signal audio avant échantillonnage afin de supprimer toute composante dont la fréquence excède la moitié de la fréquence d'échantillonnage (fréquence de Nyquist). En réalité comme les filtres ne sont pas parfaits, la fréquence d'échantillonnage est choisie légèrement supérieure au double de la fréquence audio la plus élevée. Attention les filtres ont un effet prononcé sur la qualité sonore. Quantification Quantifier un signal consiste à placer les amplitudes des échantillons sur une échelle de valeurs à intervalles fixes. Le quantificateur détermine dans quel intervalle de quantification (Q) l'échantillon se situe et à pour but de lui affecter une valeur représentant le point central de cet intervalle. Chaque amplitude possède donc un nombre binaire unique. Valeurs binaires des intervalles de quantification (quantificateur 3 bits) Dans un système binaire, le nombre de pas de quantification est égal à 2 puissance n avec n le nombre de bits utilisés par mots binaires. Donc un mot binaire de 4 bits offre 16 niveaux de quantification alors qu'un quantificateur 16 bits en offre 65536. Si les signaux dépassent la limite fixée par le nombre de bits utilisés, alors cela induit une distorsion importante car ces signaux sont tout simplement écrêtés car il n'existe pas de valeurs possibles pour les représenter. L'erreur de quantification est considérée comme un signal indésirable ajouté au signal utile. Ces signaux sont qualifiés de distorsion ou de bruit. Emploi du bruit de dispersion (dither) L'emploi du bruit de dispersion a pour effet de linéariser un convertisseur normal en transformant la distorsion de quantification en un signal aléatoire de type bruit à tous les instants. Cela est préférable car : Suréchantillonnage en conversion A/N Le suréchantillonnage est l'action d'échantillonner l'audio à une fréquence supérieure à la fréquence strictement nécessaire pour satisfaire le critère de Nyquist. Le taux élevé est passé en filtrage pour le réduire à un taux normal. Le but est de défavoriser la résolution au profit de la fréquence d'échantillonnage ce qui possède plusieurs avantages : Mise en forme du bruit (Noise shaping) La mise en forme du bruit permet de réduire le bruit dans la bande audible en augmentant le bruit à d'autres fréquences. L'énergie de la puissance du bruit de dispersion est réduite dans la bande audio. Conversion N/A Les mots sont convertis en une chaîne de niveaux de tension correspondant aux valeurs d'échantillons. Ces valeurs sont ensuite "rééchantillonnées" de façon à réduire la largeur des impulsions. Un filtre passe-bas de reconstruction de fréquence de coupure la moitié de la fréquence d'échantillonnage est ensuite utilisé. Cela permet la jointure des points d'échantillons et produit une forme d'onde linéaire. Le suréchantillonnage peut aussi être utilisé en conversion N/A, ainsi que la mise en forme du bruit. Qualité sonore L'audionumérique n'est pas forcément synonyme de grande qualité sonore et cela même s'il permet d'atteindre les limites de l'oreille humaine. La logique voudrait que le convertisseur ait un plancher du bruit correspondant au seuil de sensibilité de l'oreille. Le problème est que le seuil d'audition de l'oreille humaine est une valeur statistique. Du coup certains sons mêmes 10 dB inférieurs aux seuils admis conservent une probabilité de perception avoisinant la certitude. Il est admis que le plus fort son tolérable pour l'être humain se situe à des niveaux de pression acoustique de 130 à 140 dB. Donc la plage dynamique maximale se situe de autour de 140dB à 1kHz. Louis Fielder et Elizabeth Cohen ont tentés de définir la plage dynamique requise pour les systèmes audio de haute qualité. Ils ont établi que le niveau tout juste audible d'un bruit dont la largeur de bande est 20 kHz est d'un niveau de pression acoustique d'environ 4 dB. Ils ont défini la plage dynamique nécessaire à la reproduction naturelle à 122 dB, mais en raison des performances des microphones et enceintes elle est réduite à 115 dB. Taux d'échantillonnage Le choix du taux d'échantillonnage détermine la largeur maximale de la bande passante audio disponible. Il existe un débat concernant un taux ne dépassant pas le strict nécessaire, c'est à dire le double de la fréquence audio la plus élevée. Comme la bande de fréquence audio s'étend jusqu'à 20 kHz, les taux sont justes supérieurs à 40 kHz. Deux taux standard ont émergés :
Résolution Le nombre de bits par échantillon définit le rapport signal/bruit. Seuls les systèmes PCM (modulation par impulsions codées) linéaire vont être considérés.
La norme depuis quelques années est la modulation par impulsions codées linéaire 16 bits pour de l'audio de qualité. Mais cela ne satisfait pas les exigences de qualité de Fielder : 122 dB. On en est en fait à 90 dB. La résolution de conversion devrait être d'environ 21 bits. L'association internationale du multimédia a standardisé un ensemble de résolutions, de taux d'échantillonnage et e types de données dans le but de simplifier les échanges.
CCITT standards de l'union internationale des télécommunications |