Fiche de révision Le son, une information à coder

Les principes de la numérisation

L’enregistrement d’un son donne un signal analogique (signal électrique continu dans le temps).
La numérisation consiste à transformer un signal analogique en une suite de bits (codage binaire).
Le bit (BInary digiT) est le plus petit élément d’information qu’un ordinateur peut stocker et ne peut prendre que deux valeurs, $0$ ou $1$.
Pour numériser un signal, il faut procéder à sa discrétisation (échantillonnage et quantification).
L’échantillonnage consiste à sélectionner des valeurs à numériser dans le signal d’origine continu, composé d’une infinité de valeurs :
la durée séparant deux valeurs qui seront numérisées constitue la durée d’échantillonnage $T_e$ (plus elle est petite, plus le nombre de valeurs numérisées est grand) ;
le nombre de mesures réalisées par seconde constitue la fréquence d’échantillonnage $f_e$ ($f_e=\dfrac{1}{T_e}$).
La quantification est le fait d’attribuer une valeur numérique à chaque échantillon retenu, la quantité de valeurs numériques correspondant à la quantité de nombres binaires possibles (résolution $R$ $\rightarrow$ $R = 2^n$ (avec $n=\text{nombre de bits utilisés pour le codage}$).

numérisation bits codage

Il y a une « perte d’information » au cours du processus de numérisation, d’où l’importance de bien choisir les paramètres de numérisation de façon à obtenir une numérisation de qualité.
Lors de l’échantillonnage, plus le nombre d’échantillons retenus est élevé, plus la numérisation est fidèle au signal d’origine. On choisit donc une fréquence d’échantillonnage au moins égale au double de la fréquence du signal à échantillonner. Mais plus le nombre d’échantillons est grand, plus le nombre de données numériques est important, plus le fichier est lourd.
De même, lors de la quantification, plus le nombre de valeurs possibles est grand, plus la valeur attribuée à un échantillon est proche de sa « vraie » valeur et plus le son numérique est fidèle au son analogique. Pour augmenter ce nombre de possibilité, il faut choisir un nombre de bits plus élevé pour le codage. Mais là encore, l’augmentation du nombre de bits signifie l’augmentation de la taille du fichier numérique obtenu.
Il faut alors trouver un compromis entre la précision de la transcription du son d’origine et la taille maximale souhaitée pour le fichier numérique.

L’enjeu de la numérisation d’un signal analogique est de préserver la qualité du signal tout en limitant la taille du fichier numérique.
La taille d’un fichier audio numérique dépend de :
la fréquence d’échantillonnage (la fréquence utilisée est souvent de $44\,100\,\text{Hz}$) ;
la résolution (la plus répandue est celle liée à un codage en $16\,\text{bits}$) ;
le format stéréo ou mono ;
la durée.
La taille d’un fichier numérique s’obtient en calculant le débit binaire (nombre de bit utilisés par seconde) que l’on convertit ensuite en octets, puis en multipliant par la durée du fichier pour obtenir la taille en octets du fichier.
La compression audio consiste à réduire la taille d’un fichier audio dans le but de faciliter son stockage et sa diffusion.
Le processus de compression le plus fréquent est celui dit « avec perte de donnée » : élimination des redondances (restitution très fidèle du son, mais taux de compression faible) et adaptation aux imperfections de l’audition humaine (restitution moins fidèle du son, mais taux de compression élevé).