Actualidad
EL AUDIO DIGITAL, BAJO LA LUPA

Códigos de audio: detrás del sonido

 
11
NOV 2005

La revolución del audio digital portátil no hubiera sido posible sin la aparición de los códigos de audio, capaces de reducir de manera considerable el peso de los archivos sonoros. Además, la rápida difusión de la información musical a través de la red ha impulsado la creación de compresores cada vez más potentes, destinados al disfrute musical y a evitar que el almacenamiento se convierta en un quebradero de cabeza.

Si hablamos de un código compresor por antonomasia, éste es sin duda el MP3. Creado por el instituto Fraunhofer en comunión con la universidad de Erlangen, el MP3 supuso en 1987 una auténtica revolución al ofrecer una calidad aparentemente similar a la obtenida con los discos CD, pero con un peso hasta diez veces inferior.

Los tiempos pasan muy deprisa, y lo que durante años fue una revolución, ahora es un estándar accesible y mediante el cual millones de usuarios en todo el mundo pueden disfrutar de música allá donde vayan.

Foto: Iker Morán (Quesabesde)

Mucho han cambiado las cosas desde aquella época. Los códigos han evolucionado con mejoras y nuevas características, creándose también compresores sustitutos capaces de ofrecer mejor calidad en menor espacio. Es por ello que no sólo de MP3 vive el "audiófilo", en parte gracias a las diversas alternativas -tanto propietarias como libres- que permiten acceder a un mayor espectro de posibilidades, enfocadas a las necesidades de cada usuario y cada situación.

Además, la aparición de los códigos sin pérdidas -concepto heredado de la expresión anglosajona "lossless"- ha supuesto un giro radical en la compresión de audio: ahora es posible reducir hasta un 50% el peso del archivo original sin perder información acústica, ya sea ésta audible o no.

El modelo psicoacústico como base
Si existe una verdadera piedra filosofal en la que se basan los códigos compresores con pérdidas como el conocido MP3, es el modelo psicoacústico. Una teoría basada en algoritmos matemáticos capaz de cuantificar y calcular el nivel a partir del cual el sonido comienza a ser perceptible para el oído humano en cada banda acústica.

Mediante esta teoría, es posible desestimar aquellos sonidos imperceptibles para el ser humano, reduciendo de manera drástica la información del archivo sonoro original. Ello, evidentemente, redunda en el peso final del archivo.

Aun así, esto no es suficiente, y los códigos compresores con pérdidas aplican una serie de artefactos de compresión para reducir aún más el tamaño de la fuente. Artefactos que, en mayor o menor medida, afectan a la escucha musical y en muchas ocasiones son perfectamente perceptibles.

Los códigos "lossless" se desmarcan sustancialmente de esta filosofía, ya que su compresión es totalmente recuperable tras la descodificación, tal y como si se tratara de un archivo ZIP. Esta forma de compresión implica una calidad idéntica a la de la fuente original, pero afecta negativamente a la ratio de compresión (de 2:1, a lo sumo) y supone un aumento necesario de procesado y un menor rendimiento con respecto a los códigos con pérdidas.

El MP3: más vale malo conocido...
Ya hace algún tiempo que el MP3 ha sido superado en cuestiones de calidad y compresión, como es el caso del compresor OGG de Vorbis, de código libre y uso gratuito, o el relativamente joven AAC. Aun así, su universalidad, y el hecho de que todos o casi todos los reproductores de audio digital tomen este formato como su principal estándar, hacen que el MP3 siga estando en auge como el primer día.

La idiosincrasia de éste, así como del resto de los códigos con pérdidas, estriba en una degradación progresiva de la fidelidad -a medida que aumenta la compresión- respecto a la fuente musical original.

La compresión viene determinada por el bitrate o peso de bits por segundo, que, a su vez, puede venir definida de diversas maneras. Si se mantiene fija (por ejemplo, a 128 kbps) recibe el nombre de CBR, del inglés Constant BitRate, representando el mismo número de bits por segundo sean cuales sean las necesidades acústicas.

Por otro lado, ABR (Average BitRate) son las siglas con las que se denominan los archivos cuyo bitrate varía tan sólo ligeramente con respecto a una cantidad fija. Y si por el contrario, el bitrate varía sustancialmente en función de las necesidades de la fuente musical, estaremos hablando de VBR (Variable BitRate).

Tomando el MP3 como ejemplo, calidades por debajo de 128 kbps implican un nivel de definición muy bajo y un uso de artefactos claro y audible. A 128 kbps encontramos una calidad cercana al CD; aunque la claridad es aún escasa, los artefactos presentes y los sonidos más bajos cobran relieve. A 160 kbps existe una mejora sustancial, aunque todavía son claramente perceptibles las diferencias entre el archivo comprimido y la fuente original.

Con 192 Kbps, la definición es alta y el sonido bastante fidedigno al original. Las diferencias, en este punto, radican más en las sensaciones de espacialidad del sonido que en la definición o representación acústica.

A partir de 224 Kbps, resulta muy difícil discernir entre la fuente original y la comprimida, aun con un buen equipo. De todas maneras, la percepción y la distribución espacial de los sonidos es sensiblemente mejor en la fuente original.

Los sustitutos y competidores
Existen innumerables códigos con pérdidas alternativos al MP3, y muchos de ellos superan con creces la calidad y posibilidades de éste. De entre ellos, cabe destacar el AAC, el OGG, el WMA, el MPC y el Atrac en sus diferentes versiones.

El código con pérdidas AAC nace como el verdadero sustituto del MP3 y detrás de él están el propio instituto Fraunhofer o la multinacional japonesa Sony. Además, recibe el respaldo de otras grandes firmas, como Dolby o Apple.

El AAC posee cualidades multicanal -pueden reproducirse más de dos canales independientes-, y con un bitrate similar supera ligeramente la calidad del MP3, incluso en sus últimas versiones.

Con las siglas OGG se presenta el compresor libre por antonomasia, tanto de código como por patente. En cuestión de calidad, supera al MP3 a igual compresión, encontrándose a un nivel similar al del AAC. Permite la reproducción sin saltos entre temas -lo que los anglosajones llaman "gapless"-, una prestación muy útil sobre todo en la reproducción de álbumes en directo.

El código WMA es el intento de Microsoft por hacer frente al MP3, y en cuestiones de calidad está a la par con este último. Es el formato utilizado principalmente para la venta de archivos musicales on-line, debido al nivel de protección que proporciona sobre los derechos intelectuales.

También existe una versión libre; otra denominada WMAPro de calidad superior y con soporte multicanal; una alternativa para voz denominada WMA voice que ofrece una calidad aceptable (entre 4 y 20 kbps) en la representación de la voz, y por último, una alternativa "lossless" con el poco ingenioso nombre de WMA Lossless.

Mención especial requiere el formato Musepack o MPC, creado por Andree Buschmann y basado en los algoritmos MPEG-1 Layer 2. Muchos aseguran que se trata del mejor codificador para bitrates de más de 140 kbps. Sus sombras: el escaso apoyo de las terceras compañías y -por ende- de los reproductores portátiles de audio y su incapacidad multicanal.

Atrac, dando soporte al minidisc durante años
El gran desconocido entre los códigos de audio es, sin duda, el Atrac de Sony -de las siglas Adaptive TRansform Acoustic Engine-, sobre todo en su versión original de 292 kbps. Un olvido que quizás se deba al uso exclusivo del compresor en el ámbito del minidisc convencional y a la imposibilidad de codificarlo vía software.

Aun así, después de numerosas versiones y superando los problemas iniciáticos en los que el sonido resultaba algo metálico, el compresor de la firma nipona es considerado -hoy por hoy- como el código de audio comprimido de alto bitrate con mayor fidelidad y calidad sonora.

Todo lo contrario ocurre en las versiones más recientes, denominadas Atrac3 y Atrac3plus, cuya calidad no pasa de aceptable dentro del espectro de bitrates en el que se encuentran.

Los códigos sin pérdidas: la solución "audiófila"
Existe una ingente cantidad de soluciones "lossless" disponibles, y su uso depende de las necesidades y posibilidades de reproducción. La calidad final es siempre idéntica a la original.

De entre ellos, los más conocidos son el ALAC de Apple, con soporte para el iPod, o el código libre Flac de Josh Coalson, parte de Xiph multimedia portfolio, grupo que está detrás del también libre OGG.

Este código, cuyas siglas vienen de Free Lossless Audio Codec, dispone de prestaciones multicanal y alta resolución, es decir, con soporte para frecuencias superiores a 48 Khz o mayores de 16 bits. A su vez, el Flac tiene su presencia en algunos reproductores portátiles de audio, como los de la gama iAudio de Cowon o el ya extinto Rio Karma.

Son también destacables por su alta velocidad de codificación y descodificación el formato relativamente antiguo Sorteen de Tony Robinson, el código Wavpack de David Bryan, o el TTA, denominado también True Audio.

Junto a éstos, y con una ratio de compresión cercano al 50%, se encuentran los códigos LA (Lossless Audio) de Michael Bebin; el Monkey´s Audio -de extensión APE- creado por Matt Ashland de código abierto, alta eficiencia y alta resolución; o el OptimFrog de Florin Ghido, que se alza como el más agresivo, pero de código cerrado e incompatibilidad multicanal.

Como vemos, las posibilidades son numerosas y el uso de uno u otro formato, así como la elección de códigos con o sin pérdidas, deben estar orientados a nuestras posibilidades de reproducción, a la calidad del equipo reproductor y a las necesidades de espacio o capacidad.

0
Comentarios


  • Comenta este artículo

    No estás identificado

    Entrar