Les principes de la numérisation
- L’enregistrement d’un son donne un signal analogique (signal électrique continu dans le temps).
La numérisation consiste à transformer un signal analogique en une suite de bits (codage binaire).
- Le bit (BInary digiT) est le plus petit élément d’information qu’un ordinateur peut stocker et ne peut prendre que deux valeurs, $0$ ou $1$.
Pour numériser un signal, il faut procéder à sa discrétisation (échantillonnage et quantification).
- L’échantillonnage consiste à sélectionner des valeurs à numériser dans le signal d’origine continu, composé d’une infinité de valeurs :
la durée séparant deux valeurs qui seront numérisées constitue la durée d’échantillonnage $T_e$ (plus elle est petite, plus le nombre de valeurs numérisées est grand) ;
le nombre de mesures réalisées par seconde constitue la fréquence d’échantillonnage $f_e$ ($f_e=\dfrac{1}{T_e}$).
- La quantification est le fait d’attribuer une valeur numérique à chaque échantillon retenu, la quantité de valeurs numériques correspondant à la quantité de nombres binaires possibles (résolution $R$ $\rightarrow$ $R = 2^n$ (avec $n=\text{nombre de bits utilisés pour le codage}$).
Le choix des paramètres de numérisation
Taille d’un fichier et compression
- L’enjeu de la numérisation d’un signal analogique est de préserver la qualité du signal tout en limitant la taille du fichier numérique.
- La taille d’un fichier audio numérique dépend de :
la fréquence d’échantillonnage (la fréquence utilisée est souvent de $44\,100\,\text{Hz}$) ;
la résolution (la plus répandue est celle liée à un codage en $16\,\text{bits}$) ;
le format stéréo ou mono ;
la durée.
- La taille d’un fichier numérique s’obtient en calculant le débit binaire (nombre de bit utilisés par seconde) que l’on convertit ensuite en octets, puis en multipliant par la durée du fichier pour obtenir la taille en octets du fichier.
La compression audio consiste à réduire la taille d’un fichier audio dans le but de faciliter son stockage et sa diffusion.
- Le processus de compression le plus fréquent est celui dit « avec perte de donnée » : élimination des redondances (restitution très fidèle du son, mais taux de compression faible) et adaptation aux imperfections de l’audition humaine (restitution moins fidèle du son, mais taux de compression élevé).