Tutorial

Comprender la calidad del sonido en el ámbito digital, parte 1

¿Hasta qué punto conoces realmente la calidad de la música que estás escuchando?

Si has tenido algún tipo de problema a lo largo de tu vida intentando reconocer lo bien que suena el producto final de un archivo de audio, estás en el lugar adecuado. Este artículo será el primero de una pequeña serie, dedicada a explicar cuáles son los factores que influyen en la calidad del audio en el ámbito digital. Puede que los expertos encuentren estas explicaciones demasiado simplificadas, pero nuestro objetivo es simplificar un tema tan complejo como la calidad de audio y la reproducción de audio digital. A lo largo de este primer artículo tocaremos los temas del análisis del sonido, el análisis espectral, el audio con pérdida frente al audio sin pérdida comprimido o sin pérdida comprimido.

La caja de herramientas

Como cualquier actividad de análisis, necesitamos tener las herramientas adecuadas, y esto no es una excepción, ya que vamos a utilizar diferentes softwares para analizar nuestros archivos. Hay muchos programas que pueden ayudarte a analizar tus archivos de audio, entre otros:

  • Audacity, herramienta gratuita para grabación, masterización y análisis de audio
  • Dynamic Range Meter, una herramienta para medir el DRM de tus archivos

Sin embargo, mi favorito personal es MusicScope, un conjunto de herramientas completo e increíblemente avanzado para analizar hasta el más mínimo detalle de tus archivos. Me enamoré de él, ya que incluye todas las mediciones que puedas querer hacer en tus archivos, y es tan avanzado que aprender a explotar sus capacidades puede ser realmente interesante e instructivo. Y estamos muy contentos de tenerlo en nuestra tienda, ya que puedes comprarlo aquí en Volumio, contribuyendo a financiar nuestro increíble proyecto.

Así que, sin más dilación, ¡comencemos!

Fuentes musicales: Analógica frente a digital 

En música, hay dos tipos de fuentes: Analógicas y digitales. Para simplificar, un soporte analógico es una forma de almacenar el sonido imprimiendo físicamente la música en el soporte, creando una representación física en él. Por eso se llaman analógicas: ofrecen una representación-analogía. Mientras que una fuente musical digital es un soporte digital que ha codificado digitalmente una representación del hecho musical. Esta representación está hecha por una enorme cantidad de 1's y 0's alineados, y entregados a una cierta velocidad (reloj).

Así, mientras que los soportes analógicos suelen ser una representación de la música, los archivos digitales son siempre una aproximación, ya que son esencialmente 1 y 0 unidos por un algoritmo. Por eso, la calidad de un archivo musical viene determinada por muchos factores importantes, igualmente importantes para definir el resultado de la representación. El más obvio es su resolución, que se mide en bits y kHz (comparable a la resolución en megapíxeles de una imagen). Este tema será objeto de otro artículo para una disertación más exhaustiva. Quizá sea mejor empezar examinando las cualidades de la música que queremos preservar para obtener de ella la mayor "musicalidad" posible.

Análisis del sonido 101: Decibelios y rango dinámico

Hay muchos aspectos a la hora de entender cómo alcanza su valor la grabación final de una canción. El nivel sonoro es uno de ellos, medido en decibelios o (DB), que es una relación que utiliza un logaritmo para describir la cantidad de potencia, presión sonora, tensión o intensidad de la pieza musical que se está escuchando. Para que la música sea virtuosa, es necesario que la cantidad y la variación de la salida grabada sean exactas.

Para que un archivo se considere con buenas características debe tener un cierto nivel de rango dinámico, lo que se suele denominar Dinámica. Definir el rango dinámico no es demasiado complicado, ya que es el contraste o variación del volumen más bajo y más alto que hace el instrumento o la pieza musical. Imagínese un silencio total y, de repente, un bombo sonando: de eso trata la dinámica en la música. Normalmente, las buenas grabaciones ofrecen una gran diferencia de nivel de salida entre su sonido a menor volumen y el más alto, y eso le hará apreciar el virtuosismo del artista.

El problema es que en el mundo actual de la tecnología musical y las grabaciones, la reproducción eufónica suele comprimirse y limitarse mediante el rango dinámico, ya que permite que el volumen sea más alto. La mayoría de los ingenieros de sonido de la industria musical actual optan por reducir la dinámica para que su música suene algo más alta y sea más fácil de escuchar cuando la gente está sentada en sus coches o en reuniones sociales improvisando al ritmo de algunas melodías, y para que esa música suene alta incluso con equipos de escucha de baja calidad.

Y es una pena, ya que en el proceso se pierde una parte muy importante del mensaje musical original, lo que hace que la música resulte menos emocionante y vibrante para el oyente exigente.

A continuación se muestra una imagen que muestra el rango dinámico de Dangerous de Michael Jackson a través de los años. Como puedes ver, la dinámica del álbum se ha ido comprimiendo progresivamente hasta situarse por debajo del lado malo en la escala DR, a diferencia de los archivos impresos y sin comprimir que tienen una buena escala DR. ¡Para una explicación detallada y exhaustiva, consulte el excelente artículo "It's the mastering, stupid! Cómo las discográficas están arruinando la música".

Rango dinámico del peligroso MJ a lo largo de una década, imagen de tcervo.com

 

 La comprensión de lo que es la dinámica y el rango que tiene desempeña un papel clave en la calidad de la obra de arte porque muestra al oyente lo que no sólo es real, sino también un archivo de audio que suena bien. Para que un archivo suene bien al oído debe tener un buen rango dinámico y un buen rango dinámico viene acompañado de un equilibrio entre un volumen agradable de agudos y graves junto con el sonido natural original.

Resumiendo: evaluar el rango dinámico de tus archivos es un buen método para captar su parecido con el evento original y el cuidado que se ha puesto en la masterización de esa información musical. Veamos cómo hacerlo.

Un primer método es utilizar el Medidor de Rango Dinámico, que te dará un resultado en forma de número. Va de 1 a 20, siendo los valores inferiores a 8 absolutamente malos, los que van de 8 a 13 empiezan siendo buenos pero no óptimos y los superiores a 13 son excelentes. Básicamente, a mayor valor, mayor Rango Dinámico. Puedes leerlo en profundidad (y comparar varios valores medidos) en la página Loudness War Info. Comparemos los valores de la misma canción de Michael Jackson, Dangerous, en dos versiones diferentes (con dos procesos de remasterización distintos). La de la izquierda es la versión original, con un buen (aunque no excelente) DR, mientras que la remasterización tiene un rendimiento significativamente peor.

MusicScope y su ingeniosa herramienta de análisis espectral, de la que hablaremos más adelante, nos permiten comprender mejor las diferencias. Puedes ver la compresión dinámica en la segunda imagen.

Análisis espectral

El siguiente paso para evaluar la calidad de un archivo es el análisis espectral. Básicamente, identifica las frecuencias del archivo de música de forma visual: dependiendo de lo altas o bajas que sean las notas, el análisis espectral graficará las medidas de "todas las frecuencias frente al tiempo" en el archivo para mostrarlas en un diagrama espectral. Cuanto más baja sea la frecuencia en el archivo, más bajas serán las notas y viceversa, cuanto más alta sea la frecuencia, más altas serán las notas. El uso de un análisis espectral es una herramienta fiable para ayudar a reconocer si el archivo se ha convertido de una pieza de datos de baja calidad a una de mayor frecuencia.

¿Por qué es importante? Imagina que quieres una imagen de alta resolución de tu panorama favorito. La opción obvia sería tomar una foto con una cámara de alta resolución, ¿verdad? Bien, ahora imagina que utilizas tu cámara de alta resolución para hacer una foto de la misma panorámica, pero en lugar de enfocar la panorámica en sí, simplemente "escaneas" una foto impresa de la misma. Obtendrás dos archivos igualmente grandes, con mucha información, pero sólo uno de ellos es realmente Hi-Res. Lo mismo puede ocurrir con los archivos de audio: los de baja resolución se convierten en alta resolución.

Para saber si un archivo se ha convertido de baja calidad a alta frecuencia con el análisis espectral hay que identificar si hay "agujeros" en los rangos de frecuencias, o si hay frecuencias cortadas (las informaciones musicales no se almacenan por encima o por debajo de una determinada frecuencia).

Por ejemplo, comparemos la misma pista, en este caso Wish You were here (de un FLAC de 24/96 del máster) con diferentes codificaciones. Todas las mediciones se han realizado con el excelente analizador de espectro de SoundScope. La imagen inferior muestra el archivo original, con toda su extensión de frecuencias.

 

Ahora hacemos algo curioso: convertimos este FLAC a MP3 de 128 kbps (CBR, tasa de bits constante). Sólo con mirarlo se entiende cuánto se ha perdido del mensaje musical original.

Y ahora hacemos algo realmente extraño: transcodificamos nuestro asqueroso MP3 al formato FLAC de alta resolución. Llegados a este punto, te preguntarás: ¿para qué sirve convertir un MP3 a FLAC? En realidad, ninguno. Pero es una buena forma de demostrar lo mucho que importa el punto de partida de la codificación musical. Sobre todo si pensamos en los archivos de alta resolución que se pueden comprar en sitios web especializados: serán realmente de alta resolución SÓLO si están codificados a partir de la grabación maestra, y no (como ocurre a veces) a partir de grabaciones con calidad de CD. Esta práctica se denomina transcodificación,

Se puede ver claramente cómo la transcodificación emula de forma lineal los espectrales del MP3 de baja calidad. Y este es el truco que nos permite detectar los archivos transcodificados de menor calidad.

 

Lossy vs Compressed Lossless vs Uncompressed Lossless

Ahora que ya sabemos qué son y cómo funcionan las fuentes de música, los decibelios y el análisis espectral, podemos pasar a informarnos sobre los distintos tipos de formatos de audio y el papel que desempeñan en el entretenimiento musical. Los formatos pueden ser sin pérdida de compresión, con pérdida de compresión o con pérdida de compresión.

Un archivo de audio sin pérdidas sin comprimir almacena todos los datos originales, pero al estar sin comprimir tiende a hacer que el archivo sea mucho más grande que otros formatos. Los archivos WAV y AIFF son ejemplos de audio sin pérdidas sin comprimir. Lo que se obtiene es toda la calidad de la codificación original, pero un archivo muy pesado.

Los archivos comprimidos sin pérdida son los siguientes en la lista y, aunque también almacenan todos los datos originales (sin pérdida), son archivos menos grandes debido a que comprimen la información musical sin eliminar nada del mensaje musical original. Por ejemplo, al no dar al silencio ninguna tasa de bits por segundo, suelen tener un resultado final mejor que un archivo sin pérdidas sin comprimir.

Por último, los formatos con pérdidas siempre están comprimidos y la mayoría de las veces tienen tamaños de archivo más pequeños que los otros formatos porque eliminan parte de la información original. MP3, AAC y WMA son ejemplos de archivos con pérdidas. Un archivo MP3 es un formato codificado que se utiliza para el almacenamiento o la transmisión de audio digital, pero utiliza datos comprimidos con pérdida para minimizar el tamaño del archivo, de modo que la persona que lo escucha pueda seguir escuchando el audio original sin comprimir.

 

Resumiendo: el punto óptimo entre conservar la calidad original de la grabación sin necesidad de poseer un centro de datos es preferir compresión sin pérdidas, como FLAC (Free Lossless Audio Codec).

Eso es todo por ahora, amigos. Este será el primer artículo de una serie de escritos dedicados a entender, en términos sencillos, lo que constituye una buena experiencia de escucha en el ámbito digital. En el próximo artículo hablaremos de la profundidad de bits y las frecuencias en los archivos de audio.

Si crees que no hemos tratado lo suficiente el tema, o tienes sugerencias para los próximos temas, háznoslo saber a través de los comentarios de abajo, mientras tanto, ¡puedes dar rienda suelta a tu curiosidad y empezar a analizar tus archivos con el excelente MusicScope Audio Analyzer!

 

autor-avatar

Sobre Michelangelo Guarise

Apasionado. Hereje. Profundamente enamorado de la tecnología y la música. Vivo en Florencia, Italia, donde enseño Diseño de Interacción y Marketing. Soy el fundador y CEO de Volumio, y me encanta cada segundo de esta gran aventura. Mi equipo de audio es una extraña mezcla de amplificadores de válvulas y digitales, todos construidos por mí mismo en algunas frías noches de insomnio invernal. Y no puedo bajar el volumen.