Tutoriel

Comprendre la qualité du son dans le domaine numérique, partie 1

Connaissez-vous vraiment la qualité de la musique que vous écoutez ?

Si, au cours de votre vie, vous avez eu des difficultés à reconnaître la qualité du produit final d'un fichier audio, vous êtes au bon endroit. Cet article sera le premier d'une petite série visant à expliquer les facteurs qui influencent la qualité audio dans le domaine numérique. Les experts parmi vous trouveront peut-être ces explications trop simples, mais notre objectif est de simplifier un sujet aussi complexe que la qualité audio et la reproduction audio numérique. Tout au long de ce premier article, nous aborderons les thèmes de l'analyse du son, de l'analyse spectrale, de l'audio avec perte par rapport à l'audio non compressé ou compressé sans perte.

La boîte à outils

Comme pour toute activité d'analyse, nous devons disposer des bons outils, et ceci ne fait pas exception puisque nous utiliserons différents logiciels pour analyser nos fichiers. Il existe de nombreux logiciels qui peuvent vous aider à analyser vos fichiers audio, entre autres :

  • Audacity, outil gratuit pour l'enregistrement, le mastering et l'analyse audio
  • Dynamic Range Meter, un outil pour mesurer le DRM de vos fichiers

Cependant, mon préféré est MusicScope, un ensemble d'outils complet et incroyablement avancé pour analyser chaque détail de vos fichiers. Je suis tombé amoureux de cet outil, car il comprend toutes les mesures que vous voudrez faire sur vos fichiers, et il est si avancé qu'apprendre à exploiter ses capacités peut être vraiment intéressant et instructif. Et nous sommes très heureux de l'avoir dans notre boutique, car vous pouvez l'acheter ici sur Volumio, contribuant ainsi au financement de notre formidable projet.

Alors, sans plus attendre, commençons !

Sources de musique : Analogique ou numérique 

En musique, il existe deux types de sources : Les sources analogiques et les sources numériques. Pour simplifier, un support analogique est un moyen de stocker le son en imprimant physiquement la musique sur le support, en créant une représentation physique sur celui-ci. C'est pourquoi on les appelle analogiques : ils offrent une représentation-analogie. En revanche, une source de musique numérique est un support numérique qui a encodé numériquement une représentation de l'événement musical. Cette représentation est faite d'une énorme quantité de 1 et de 0 alignés les uns à côté des autres, et délivrés à une certaine vitesse (horloge).

Ainsi, alors que les supports analogiques sont généralement une représentation de la musique, les fichiers numériques sont toujours une approximation, puisqu'il s'agit essentiellement de 1 et de 0 liés par un algorithme. C'est pourquoi la qualité d'un fichier musical est déterminée par de nombreux facteurs, tous aussi importants les uns que les autres pour définir le résultat de la représentation. Le plus évident est sa résolution, mesurée en bits et en kHz (comparable à la résolution en mégapixels d'une image). Ce sujet fera l'objet d'un autre article pour une dissertation plus complète. Il serait peut-être préférable de commencer par examiner les qualités de la musique que nous voulons préserver pour en tirer le maximum de "musicalité".

Analyse du son 101 : Décibels et gamme dynamique

De nombreux aspects entrent en ligne de compte lorsqu'il s'agit de comprendre comment l'enregistrement final d'une chanson atteint sa valeur. Le niveau sonore est l'un d'entre eux, mesuré en décibels ou (DB), qui est un rapport utilisant un logarithme pour décrire la puissance, la pression sonore, la tension ou l'intensité de la pièce musicale que vous écoutez. Pour obtenir une musique de qualité, il faut que la quantité et la variation de la sortie enregistrée soient exactes.

Pour qu'un fichier soit considéré comme ayant de bonnes caractéristiques, il doit avoir un certain niveau de gamme dynamique, généralement appelé "dynamique". La définition de la gamme dynamique n'est pas très compliquée : il s'agit du contraste ou de la variation du volume le plus faible et le plus fort produit par l'instrument ou le morceau de musique. Imaginez un silence complet et soudain un coup de tambour : voilà ce qu'est la dynamique en musique. En règle générale, les bons enregistrements offrent une grande différence de niveau de sortie entre le son le plus faible et le plus fort, ce qui vous permettra d'apprécier la virtuosité de l'artiste.

Le problème est que dans le monde actuel de la technologie musicale et des enregistrements, la lecture euphonique est généralement comprimée et limitée par la gamme dynamique, qui permet d'augmenter le volume. La plupart des ingénieurs du son de l'industrie musicale actuelle choisissent de supprimer la dynamique afin que leur musique sonne un peu plus fort et soit plus facile à écouter lorsque les gens sont assis dans leur voiture ou lors de réunions sociales en train d'écouter de la musique, et que cette musique sonne fort même avec du matériel d'écoute de faible qualité.

Et c'est dommage, car ce faisant, une partie très importante du message musical original se perd, ce qui rend la musique moins excitante et moins vivante pour l'auditeur averti.

Voici une image qui montre la gamme dynamique de Dangerous de Michael Jackson à travers les années. Comme vous pouvez le voir, la dynamique de l'album a été progressivement compressée jusqu'à atteindre le mauvais côté de l'échelle DR, contrairement aux fichiers imprimés et non compressés qui ont une bonne échelle DR. Pour une explication détaillée et complète, consultez l'excellent article "It's the mastering, stupid ! Comment les maisons de disques ruinent la musique".

Gamme dynamique de MJ dangereux sur une décennie, image de tcervo.com

 

 La compréhension de ce qu'est la dynamique et de sa portée joue un rôle clé dans la qualité de l'œuvre d'art, car elle montre à l'auditeur ce qui est non seulement réel, mais aussi ce qui constitue un fichier audio de bonne qualité. Pour qu'un fichier sonne bien à l'oreille, il doit avoir une bonne gamme dynamique et une bonne gamme dynamique s'accompagne d'un équilibre entre un volume agréable d'aigus et de graves et le son naturel d'origine.

En bref : l'évaluation de la gamme dynamique de vos fichiers est une bonne méthode pour apprécier leur ressemblance avec l'événement original et le soin apporté à la maîtrise de ces informations musicales. Voyons comment vous procédez.

Une première méthode consiste à utiliser un appareil de mesure de la gamme dynamique, qui vous donnera un résultat sous la forme d'un chiffre. Il va de 1 à 20, les valeurs inférieures à 8 étant absolument mauvaises, les valeurs comprises entre 8 et 13 commencent à être bonnes mais pas optimales et les valeurs supérieures à 13 sont excellentes. En principe, plus la valeur est élevée, plus la plage dynamique est importante. Vous pouvez lire l'article en détail (et comparer plusieurs valeurs mesurées) sur la page Loudness War Info. Comparons donc les valeurs de la même chanson de Michael Jackson, Dangerous, dans deux versions différentes (avec deux processus de remasterisation différents). La version de gauche est la version originale, avec un bon (mais pas excellent) DR, tandis que la version remasterisée est nettement moins performante.

Nous pouvons avoir un meilleur aperçu de la différence en utilisant MusicScope et son outil intelligent d'analyse spectrale, que nous aborderons plus en détail dans la section suivante. Vous pouvez voir la compression dynamique dans la deuxième image.

Analyse spectrale

L'étape suivante pour évaluer la qualité de votre fichier consiste à examiner l'analyse spectrale. Fondamentalement, elle identifie les fréquences du fichier musical d'une manière visuelle : en fonction de la hauteur des notes, l'analyse spectrale représentera graphiquement les mesures de "toutes les fréquences en fonction du temps" dans le fichier pour les afficher dans un diagramme spectral. Plus la fréquence du fichier est basse, plus les notes sont basses et inversement, plus la fréquence est élevée, plus les notes sont hautes. L'utilisation d'une analyse spectrale est un outil fiable qui permet de reconnaître si le fichier a été converti d'un élément de données de faible qualité en un élément de données de fréquence plus élevée.

Pourquoi est-ce important ? Imaginez que vous souhaitiez obtenir une image haute résolution de votre panorama préféré. Le choix le plus évident serait de prendre une photo avec un appareil photo haute résolution, n'est-ce pas ? Imaginez maintenant que vous utilisiez votre appareil photo haute résolution pour prendre une photo du même panorama, mais qu'au lieu de faire la mise au point sur le panorama lui-même, vous vous contentiez de "scanner" une photo imprimée de celui-ci. Vous obtiendrez deux fichiers de même taille, contenant beaucoup d'informations, mais un seul d'entre eux est réellement haute résolution. La même chose peut se produire avec les fichiers audio, les fichiers basse résolution étant convertis en haute résolution.

Pour savoir si un fichier a été converti d'un fichier de basse qualité à un fichier de haute fréquence avec l'analyse spectrale, vous voulez identifier s'il y a des "trous" dans les plages de fréquences, ou s'il y a des fréquences coupées (les informations musicales ne sont pas stockées au-dessus ou au-dessous d'une certaine fréquence).

Par exemple, comparons le même morceau, dans ce cas Wish You were here (à partir d'un FLAC 24/96 du master) avec différents encodages. Toutes les mesures sont prises avec l'excellent analyseur de spectre de SoundScope. L'image ci-dessous montre le fichier original, avec toute son extension de fréquence.

 

Maintenant, nous faisons quelque chose d'amusant : nous convertissons ce FLAC en 128kbps (CBR, constant bit rate) MP3. Il suffit de regarder ce fichier pour comprendre à quel point le message musical original a été perdu.

Et maintenant, nous faisons quelque chose de vraiment bizarre : nous transcodons notre méchant MP3 au format FLAC haute résolution. À ce stade, vous vous demandez peut-être : quel est l'intérêt de reconvertir un MP3 au format FLAC ? En fait, aucun. Mais c'est un bon moyen de démontrer que le point de départ de l'encodage musical est très important. Surtout si l'on pense aux fichiers haute résolution que l'on peut acheter sur des sites spécialisés : ils ne seront réellement haute résolution QUE s'ils sont encodés à partir de l'enregistrement original, et non (comme cela arrive parfois) à partir d'enregistrements de qualité CD. Cette pratique s'appelle le transcodage,

Vous pouvez clairement voir comment le transcodage émule de manière linéaire les spectres du MP3 de faible qualité. C'est cette astuce qui nous permet de repérer les fichiers transcodés de qualité inférieure.

 

Lossy vs Compressed Lossless vs Uncompressed Lossless

Maintenant que nous avons bien compris ce que sont les sources de musique, les décibels et l'analyse spectrale et comment ils fonctionnent, nous pouvons enfin passer à l'étape suivante et obtenir des informations sur les différents types de formats audio existants et le rôle qu'ils jouent dans les loisirs musicaux. Les formats sont soit des fichiers non compressés sans perte, compressés sans perte ou avec perte.

Un fichier audio non compressé sans perte stocke toutes les données d'origine, mais le fait d'être non compressé tend à rendre le fichier beaucoup plus volumineux que les autres formats. Les fichiers WAV et AIFF sont des exemples de fichiers audio non compressés sans perte. Vous bénéficiez de toute la qualité de l'encodage d'origine, mais le fichier est très lourd.

Les fichiers compressés sans perte sont les suivants sur la liste et, bien qu'ils stockent également toutes les données originales (sans perte), ils sont moins volumineux en raison de la compression des informations musicales sans supprimer le message musical original. Par exemple, en ne donnant au silence aucun débit binaire par seconde, le résultat final est généralement meilleur que celui d'un fichier sans perte non compressé.

Enfin, les formats avec perte sont toujours compressés et la plupart du temps, la taille des fichiers est inférieure à celle des autres formats, car ils éliminent une partie de l'information originale. Les fichiers MP3, AAC et WMA sont tous des exemples de fichiers avec perte. Un fichier MP3 est un format codé utilisé pour le stockage ou la transmission de données audio numériques, mais il utilise des données compressées avec perte pour minimiser la taille du fichier de sorte que le fichier puisse encore ressembler à l'audio original non compressé pour la personne qui l'écoute.

 

Pour faire court : le meilleur compromis entre la préservation de la qualité originale de l'enregistrement et la nécessité de posséder un centre de données est de préférer les fichiers compressés sans perte, comme le FLAC (Free Lossless Audio Codec).

C'est tout pour l'instant. Il s'agit du premier article d'une série d'écrits visant à comprendre, en termes simples, ce qui constitue une bonne expérience d'écoute dans le domaine numérique. Dans le prochain article, nous parlerons de la profondeur de bits et des fréquences dans les fichiers audio.

Si vous pensez que nous n'avons pas couvert suffisamment le sujet, ou si vous avez des suggestions pour les prochains sujets, faites-le nous savoir via les commentaires ci-dessous. En attendant, vous pouvez libérer votre curiosité et commencer à analyser vos fichiers avec l'excellent MusicScope Audio Analyzer!

 

auteur-avatar

À propos de Michelangelo Guarise

Passionnés. Hérétique. Profondément amoureux de la technologie et de la musique. Je vis à Florence, en Italie, où j'enseigne le design d'interaction et le marketing. Je suis le fondateur et le PDG de Volumio et j'adore chaque seconde de cette grande aventure. Mon matériel audio est un mélange étrange d'amplificateurs à lampes et d'amplificateurs numériques, tous construits par mes soins au cours de nuits d'hiver sans sommeil. Et je n'arrive pas à baisser le volume.