Qu'est ce qu'une conversion analogique / numérique ?


Un signal audio analogique est une forme d'onde électrique continue dans le temps. Un convertisseur Analogique / Numérique traduit ce signal en séquences de nombres binaires.

Le processus de conversion A/N a une incidence majeure sur la qualité finale du signal audionumérique. En effet la qualité d'un signal audio une fois converti ne peut jamais s'améliorer.

Les principaux paramètres influant sur la qualité audio sont le taux d'échantillonnage et le nombre de bits par échantillon.
Le convertisseur de base intégré à l'ordinateur multimédia est un convertisseur 16 bits/44,1 kHz. Le convertisseur très haut de gamme est plutôt un convertisseur 24 bits/96 kHz.

Retour haut de la page


Echantillonnage


L'échantillonnage consiste à mesurer l'amplitude de la forme d'onde à des intervalles de temps réguliers.


Echantillonnage d'un signal audio quelconque
Echantillonnage d'un signal audio quelconque


Les impulsions représentent les amplitudes instantanées du signal à chaque instant t. Les échantillons peuvent être considérés comme des images instantanées du signal audio et donnent assemblés une représentation de la formes d'onde continue.

Plus le nombre d'échantillons sera grand plus, plus le signal sera représenté finement. Shannon indique que pour obtenir les informations nécessaires pour caractériser le signal, il faut prélever au moins 2 échantillons par cycles audio.
Le problème d'aliasing (ou repliement de spectre) produit lors de la reconstruction du signal d'origine si le nombre d'échantillons n'est pas assez grand. Le signal reconstruit n'est pas similaire au signal initial.

Le processus d'échantillonnage peut être visualisé en le considérant en termes de modulation. La forme d'onde audio continue est utilisée pour moduler une chaîne régulière d'impulsions. La fréquence de ces impulsions est la fréquence d'échantillonnage. Ce procédé est appelé Modulation d'impulsions en amplitude (PAM).

Retour haut de la page


Filtrage et aliasing


Afin d'éviter le phénomène d'alias vu ci-dessus, il est nécéssaire de filtrer le signal audio avant échantillonnage afin de supprimer toute composante dont la fréquence excède la moitié de la fréquence d'échantillonnage (fréquence de Nyquist).
En réalité comme les filtres ne sont pas parfaits, la fréquence d'échantillonnage est choisie légèrement supérieure au double de la fréquence audio la plus élevée.
Attention les filtres ont un effet prononcé sur la qualité sonore.

Retour haut de la page


Quantification


Quantifier un signal consiste à placer les amplitudes des échantillons sur une échelle de valeurs à intervalles fixes.
Le quantificateur détermine dans quel intervalle de quantification (Q) l'échantillon se situe et à pour but de lui affecter une valeur représentant le point central de cet intervalle.
Chaque amplitude possède donc un nombre binaire unique.


Valeurs binaires des intervalles de quantification (quantificateur 3 bits)
Valeurs binaires des intervalles de quantification


Dans un système binaire, le nombre de pas de quantification est égal à 2 puissance n avec n le nombre de bits utilisés par mots binaires.
Donc un mot binaire de 4 bits offre 16 niveaux de quantification alors qu'un quantificateur 16 bits en offre 65536.
Si les signaux dépassent la limite fixée par le nombre de bits utilisés, alors cela induit une distorsion importante car ces signaux sont tout simplement écrêtés car il n'existe pas de valeurs possibles pour les représenter.

L'erreur de quantification est considérée comme un signal indésirable ajouté au signal utile. Ces signaux sont qualifiés de distorsion ou de bruit.

Retour haut de la page


Emploi du bruit de dispersion (dither)


L'emploi du bruit de dispersion a pour effet de linéariser un convertisseur normal en transformant la distorsion de quantification en un signal aléatoire de type bruit à tous les instants.
Cela est préférable car :
  • un bruit blanc à très bas niveau est moins gênant qu'une distorsion.
  • les signaux sont fondus en douceur sans soudaine disparition.
  • cela permet une reconstitution des signaux.


  • Retour haut de la page


    Suréchantillonnage en conversion A/N


    Le suréchantillonnage est l'action d'échantillonner l'audio à une fréquence supérieure à la fréquence strictement nécessaire pour satisfaire le critère de Nyquist. Le taux élevé est passé en filtrage pour le réduire à un taux normal.
    Le but est de défavoriser la résolution au profit de la fréquence d'échantillonnage ce qui possède plusieurs avantages :
  • améliorer la qualité sonore lors des phases de conversion.
  • les répétitions spectrales résultant du PAM sont rejetées loin de la limite supérieure de la bande audio.
  • remplacement du filtre anti-aliasing analogique en filtre de décimation numérique.


  • Retour haut de la page

    Mise en forme du bruit (Noise shaping)


    La mise en forme du bruit permet de réduire le bruit dans la bande audible en augmentant le bruit à d'autres fréquences. L'énergie de la puissance du bruit de dispersion est réduite dans la bande audio.

    Retour haut de la page


    Conversion N/A


    Les mots sont convertis en une chaîne de niveaux de tension correspondant aux valeurs d'échantillons.
    Ces valeurs sont ensuite "rééchantillonnées" de façon à réduire la largeur des impulsions. Un filtre passe-bas de reconstruction de fréquence de coupure la moitié de la fréquence d'échantillonnage est ensuite utilisé. Cela permet la jointure des points d'échantillons et produit une forme d'onde linéaire.
    Le suréchantillonnage peut aussi être utilisé en conversion N/A, ainsi que la mise en forme du bruit.

    Retour haut de la page


    Qualité sonore


    L'audionumérique n'est pas forcément synonyme de grande qualité sonore et cela même s'il permet d'atteindre les limites de l'oreille humaine.

    La logique voudrait que le convertisseur ait un plancher du bruit correspondant au seuil de sensibilité de l'oreille. Le problème est que le seuil d'audition de l'oreille humaine est une valeur statistique. Du coup certains sons mêmes 10 dB inférieurs aux seuils admis conservent une probabilité de perception avoisinant la certitude.

    Il est admis que le plus fort son tolérable pour l'être humain se situe à des niveaux de pression acoustique de 130 à 140 dB. Donc la plage dynamique maximale se situe de autour de 140dB à 1kHz.
    Louis Fielder et Elizabeth Cohen ont tentés de définir la plage dynamique requise pour les systèmes audio de haute qualité. Ils ont établi que le niveau tout juste audible d'un bruit dont la largeur de bande est 20 kHz est d'un niveau de pression acoustique d'environ 4 dB. Ils ont défini la plage dynamique nécessaire à la reproduction naturelle à 122 dB, mais en raison des performances des microphones et enceintes elle est réduite à 115 dB.

    Taux d'échantillonnage

    Le choix du taux d'échantillonnage détermine la largeur maximale de la bande passante audio disponible.
    Il existe un débat concernant un taux ne dépassant pas le strict nécessaire, c'est à dire le double de la fréquence audio la plus élevée. Comme la bande de fréquence audio s'étend jusqu'à 20 kHz, les taux sont justes supérieurs à 40 kHz. Deux taux standard ont émergés :
  • 44.1 kHz du disque compact
  • 48 kHz plus "professionnel".



  • Fréquences d'échantillonnages courantes
    Fréquences (kHz) Application
    8 Téléphonie.
    Basse qualité audio standard.
    ~ 11.025 Un quart du taux CD
    (Macintosh pour audio basse qualité)
    16 Certaines applications téléphoniques
    18.9 Standard CD-ROM/XA et CD-I
    Qualité basse à moyenne
    ~ 22.05 Moitié du taux CD
    (Macintosh)
    32 Exploité par certains systèmes broadcast
    (Nicam 3, Nicam 728)
    Mode DAT longue durée.
    37.8 Taux du CD-ROM/XA et CD/I
    Qualité intermédiaire.
    44.056 Légère modification du taux 44.1
    Utilisé pour s'aligner sur le taux NTSC
    (29.97 images/secondes)
    44.1 Taux du CD
    Très exploité en milieu professionnel sur de nombreux formats
    47.952 A éviter.
    Rencontré avec de la vidéo NTSC
    48 Taux professionnel certifié par l'AES5-1984
    88.2 et 96 Double des standards 44.1 et 48
    En train de devenir le standard
    pour la très haute qualité professionnelle


    Résolution

    Le nombre de bits par échantillon définit le rapport signal/bruit. Seuls les systèmes PCM (modulation par impulsions codées) linéaire vont être considérés.


    Résolutions en quantification linéaire
    Bits par échantillon Plage dynamique
    approximative avec
    bruit de dispersion
    Application
    8 44 dB Qualité basse/Modérée pour multimédia
    En cours de péremption
    12 68 dB Anciens échantillonneurs Akaî
    14 80 dB Format EIAJ d'origine des adapteurs PCM (Sony)
    16 92 dB Standard CD - DAT
    Résolution grand public haute qualité
    20 116 dB Enregistrement professionnel
    Haute qualité
    24 140 dB Résolution professionnelle
    de très haute qualité
    Dépasse les besoins psycho acoustique


    La norme depuis quelques années est la modulation par impulsions codées linéaire 16 bits pour de l'audio de qualité. Mais cela ne satisfait pas les exigences de qualité de Fielder : 122 dB. On en est en fait à 90 dB. La résolution de conversion devrait être d'environ 21 bits.

    L'association internationale du multimédia a standardisé un ensemble de résolutions, de taux d'échantillonnage et e types de données dans le but de simplifier les échanges.


    Taux d'échantillonnage et quantifications recommandés par l'IMA
    Taux
    d'échantillonnage
    Mono/Stéréo Quantification Notes
    8 kHz Mono
    Mono
    Mono
    PCM u-law 8 bits
    PCM A-law 8 bits
    ADPCM 4 bits
    Standard CCITT G.711
    Standard CCITT G.711
    Algo Intel/DVI
    11.025 kHz Mono/Stéréo
    Mono/Stéréo
    PCM Linéaire 8 bits
    ADPCM 4 bits
    Macintosh et MPC
    Algo Intel/DVI
    22.05 kHz Mono/Stéréo
    Mono/Stéréo
    PCM Linéaire 8 bits
    ADPCM 4 bits
    Macintosh et MPC
    Algo Intel/DVI
    44.1 kHz Mono/Stéréo
    Mono/Stéréo
    Mono/Stéréo
    PCM linéaire 16 bits
    PCM linéaire 16 bits
    ADPCM 4 bits
    LSB d'abord
    MSB d'abord
    Algo Intel/DVI
    MPC : standard Microsoft multimédia PC
    CCITT standards de l'union internationale des télécommunications


    Retour haut de la page




    Dernière mise à jour le 5 décembre 2001.
    Réalisée par Matthieu Guenebaud.