Sebsite.org
 Retour | Index  |  Minidisc  |  Tour rapide  |  Plan du site  |  Forums  |  A propos 
Accueil > Minidisc > Dossier technique > La compression ATRAC >  
Rechercher
 Recherche simple :
Google
Web Sebsite.org
 
DOSSIER MINIDISC
Le codeur - Partie 1/2
MISE EN APPLICATION DE LA PSYCHOACOUSTIQUE

Le cahier des charges du codeur ATRAC est de compresser les données numériques de façon à n'en garder que 1/5, tout en conservant une qualité sonore subjective compatible avec les standards de la haute-fidélité. Pour cela, il va travailler en tenant compte des limites et des défauts de l'oreille et du cerveau de l'auditeur.

Les effets de masking rendent inutiles des portions entières du signal audio. De même, certaines bandes critiques sont plus larges que d'autres et méritent moins de définition (voir le chapitre sur la psycho-acoustique). Le point de départ de la transformation est le signal stéréo PCM issu du disque compact. Il est codé sur 16 bits, avec une fréquence d'échantillonnage de 44,1 kHz.

Le codeur procède en trois étapes comme le montre la figure ci-dessous :
1. Création des BFUs ou Bloc Floating Units :
a) le signal est divisé en trois bandes par les filtres QMF,
b) chacune de ces trois bandes est transformée par les blocs MDCT en domaines de fréquences produisant ainsi des bandes (spectres ou raies) avec chacune un coefficient ; il y en a 512 ; on parle de bandes critiques,
c) ces coefficients sont groupés non uniformément en blocs, les BFUs.
2. Une allocation appropriée des bits les réorganise en mettant les bits de poids forts en début de mots.
3. Une quantification réduit la taille des données en ne laissant passer finalement que les données non significatives, ce en vertu de l'effet de masking.

Les filtres QMF>
Ils divisent le signal en trois bandes :
- de 0 à 5,512 kHz,
- de 5,512 à 11,025 kHz,
- et de 11,025 à 22,05 kHz.

Les blocs MDCT>
Chacune des bandes est alors transformée en "domaine" de fréquences par la fonction MDCT : Modified Discrete Cosine Transform. C'est l'équivalent d'une transformée rapide de Fourier (F.F.T., Fast Fourier Transform) afin "d'orthogonaliser" le signal et de travailler sur des axes différents, à savoir le temps et la fréquence. Exit l'amplitude qui est traduite en un coefficient spectral pour chaque bande.

Mode court - mode long>
Le codeur choisi la longueur des blocs en fonction des caractéristiques du signal dans chaque bande. Il choisi entre deux modes :
- le mode long : 11,6 msec,
- le mode court : 1,45 msec dans les fréquences hautes (aigus) et 2,9 pour les autres.
Pourquoi ces deux modes ?
Le mode long donne une meilleure résolution fréquentielle. Toutefois, un problème intervient pendant les attaques (montées rapides) du signal. Plus précisément, le bruit de quantification augmente rapidement et n'est plus masqué. C'est le pré écho. Pour l'éviter, le codeur détecte les attaques et passe en mode court. Le bruit est toujours présent, mais sur un segment court. Il est masqué par l'effet de backward masking.
Le backward masking est certes effectif sur une courte portion, mais puisque le mode court réduit la durée du bruit, l'oreille ne l'entend pas. L' ATRAC peut alors coder les passages plus stables, tout en ayant répondu aux attaques.
Remarque : le même problème se produit lorsque le signal décroît rapidement, mais le forward masking dure plus longtemps que le backward masking. Le phénomène inverse ne pose aucun problème.

Seb, Sebsite.org
© 1998-2010 - Sebsite.org

< Psychoacoustique Le codeur - Partie 2/2 >

Déposer votre avis >

Dans ce dossier
Psychoacoustique
Le codeur - Partie 2/2
Différentes versions d'ATRAC
La multi-génération
Le système de protection SCMS

Thèmes associés
ATRAC
Le décodeur
Tous les thèmes du site

 - Vous avez une question ?
 - Retour au chapitre
"La compression ATRAC"




< Retour |  Index  |  Tour rapide  |  Plan du site  |  Contact  |  A propos  |  Haut de page 
  © 1999-2010, Sebsite.org