Monografías
Publicar | Monografías por Categorías | Directorio de Sitios | Software Educativo | Juegos Educativos | Cursos On-Line Gratis

 

Dolby Digital - Monografía



 
DESCARGA ESTA MONOGRAFÍA EN TU PC
Esta monografía en formato html para que puedas guardarla en tu pc e imprimirla.



Vínculo Patrocinado




Aquí te dejamos la descarga gratuita
Nota: para poder abrir archivos html solo necesitas tener instalado internet explorer u otro navegador web.




Sistemas de sonido. Formatos. Características. Prologic. Canales. Algoritmo de codificación. Codificador y descodificador. Diagrama de bloques. Filtros



1.    INTRODUCCIÓN:



Dolby Digital es el último y más innovador sistema de sonido desarrollado por los Laboratorios Dolby, cuya experiencia en este campo es muy amplia: ya a finales de los años 60, estos laboratorios innovaron en la grabación de sonido en cinta magnética, con el lanzamiento de los sistemas de reducción de ruido Dolby A (profesional) y Dolby B (doméstico).
Durante la década de los 70 Dolby revolucionó la sonorización en el cine con la introducción del sistema analógico Dolby Stereo, con cuatro canales, tres en el frente del cine (derecho e izquierdo para música y efectos, y el central para voces) y el cuarto canal (trasero) para efectos  “sorround” (envolvente).
Luego, ya en los 80 Dolby inventó el muy mejorado “Dolby SR”(Sprectum Recording) para uso tanto en cintas como en cines, junto con la introducción a finales de los 80 del Dolby Surround (analógico) y más tarde del Dolby Pro-Logic (digital), que básicamente aplicaban la tecnología Dolby Stereo a las cintas de vídeo y LaserDiscs.
El sistema de sonido seleccionado como standard para el DVD, denominado originariamente como AC-3 (Audio Configuration 3rd Generation), fue estrenado el film “Batman Returns” en el año 1992. Posteriormente, más de mil películas han usado este sistema.
Por último aparece el sistema Dolby Digital, que nos proporciona sonido envolvente gracias a la utilización de seis canales totalmente independientes: tres canales frontales (izquierdo, derecho y central), dos canales surround (izquierdo y derecho) y un canal de graves dedicado a reforzar los efectos. Este canal de  graves está limitado en banda de 20 a 120 Hz, mientras que los otros cinco presentan una respuesta en frecuencia de 20 Hz a 20kHz, por lo que se habla de un sistema de 5.1 canales, en el que la situación de los altavoces sería la siguiente :
6208.gif

Figura 1. Situación de los altavoces en sistemas de 5.1 canales.
En los sistemas Dolby Sorround y Dolby Pro-Logic se consigue una separación entre canales de 20 y 30 dB respectivamente en el mejor de los casos; esta limitación viene impuesta por la codificación matricial de los múltiples canales mediante la que se consigue almacenar la información de cuatro canales en sólo dos pistas mediante una serie de desfases y relaciones matemáticas entre ellos.
Dolby Digital mejora este aspecto con respecto a sus predecesores ya que consigue una perfecta separación entre sus seis canales, puesto que son totalmente independientes unos de otros, logrando crear una mayor sensación de realismo.
En rango dinámico de la banda sonora de una película que es proyectada en una sala no es el apropiado para escuchar en casa, puesto que el volumen con es editada la cinta para su reproducción en un cine es mucho mayor que el volumen con el que vemos las películas en casa. Debido a esto, en muchas ocasiones se restringe el margen dinámico de los programas para radiodifusión, aplicando una compresión adicional antes de emitir el programa, con lo que el sonido pierde calidad. El sistema Dolby Digital permite editar la banda sonora de una película con todo su rango dinámico para su emisión en salas, dando a elegir a  la productora distintos tipos de compresión para otros usos, como vídeo o radiodifusión. Lo mismo es aplicable a bandas sonoras producidas exclusivamente para la televisión.
Cuando la banda sonora es reproducida en casa, Dolby Digital presenta al usuario diferentes opciones: rango dinámico completo, la compresión aplicada por la productora o aquella que mejor se adapte a su gusto.
Otro problema muy común es la variación de volumen existente entre diferentes cadenas de televisión o formatos de vídeo (VHS, LaserDisc…), que nos obliga a cambiar el volumen al cambiar de unos a otros.
El sistema Dolby Digital presenta una función de normalización de diálogos, mediante la que se detecta la diferencia de volumen entre diferentes fuentes, para adaptarlo automáticamente al pasar de unas a otras.
Otra característica de este formato es la flexibilidad con que se maneja el canal de graves, pudiendo dirigirlo a un único altavoz, si se dispone de un woofer, o repartiéndolo entre el resto de los altavoces, en caso de carecer del woofer.
La codificación de audio digital que se usa en el Compact Disc (16-bit PCM) consigue un rango dinámico de 96 dB a costa de trabajar a una frecuencia 44,1 Khz. con muestras de 16 bits, lo que supone una cantidad de datos excesiva para ser almacenada o transmitida de forma económica, sobre todo en sistemas multicanal. Por ello surge la necesidad de utilizar otros métodos de codificación, también llamados algoritmos de codificación perceptiva, que reduzcan la tasa de bits con una mínima degradación de la calidad del sonido; se trata por tanto de sistemas de codificación con pérdidas. El algoritmo de codificación Dolby AC-3 cumple estos requisitos, consiguiendo tasas de compresión 10:1 además de permitir diferentes tasas de bits según el número de canales codificados o la calidad que se necesite, por lo que es la base de los sistemas Dolby Digital. Gracias a este algoritmo se consiguen almacenar los 5.1 canales en el espacio que un CD dedicaría a una sola pista de audio.

2.    Formatos Dolby Digital:



El estándar norteamericano de Televisión de Alta Definición de la Grand Alliance ya ha adoptado como sistema de sonido envolvente el Dolby Digital, que ya se utilizó de forma experimental en la retransmisión de los juegos olímpicos de 1996.
La Televisión Digital por Cable es otro formato idóneo para la utilización de Dolby Digital, tanto por sus características como por razones de estandarización con la HDTV. Se ha desarrollado una versión de dos canales para este tipo de aplicaciones, puesto que la programación actual trabaja en mono, estéreo o estéreo surround matricial.
En el LaserDisc ya se ha introducido este sistema multicanal, sustituyendo uno de los canales analógicos modulados en FM por una trama de bits Dolby Digital y dejando intactos un canal PCM estéreo y un canal FM por razones de compatibilidad con los equipos ya existentes.
En la industria del cine la banda sonora Dolby Digital se graba ópticamente en la misma cinta que contiene la película en el espacio entre los agujeros tal como muestra la figura:

6209.gif

Situación de la trama Dolby Digital en cintas de cine.

Insertando la trama de bits directamente en la película se consigue la coexistencia con las pistas analógicas, evitando la necesidad de insertar otro medio de almacenamiento como podría ser el CD, lo que repercute positivamente en los distribuidores y propietarios de salas.
Además, el espacio entre los agujeros de la cinta es una zona de gran resistencia a deformaciones y la humedad, por lo que la pista Dolby Digital permanecerá intacta durante toda la vida útil de la película.
Ejemplos de títulos que se han lanzado incluyendo banda sonora Dolby Digital : 12 Monos, Abyss, Aladdin, Batman Forever…

Otro formato que ha adoptado como estándar de sonido envolvente el sistema Dolby Digital ha sido el Digital Versatile Disc (DVD) en cuyos equipos reproductores se incluye una salida óptica para la trama Dolby Digital. Para disfrutar del sonido envolvente se necesita un descodificador AC-3, que se conectará a la salida correspondiente del DVD, un amplificador Dolby Digital y cinco altavoces.
En Marzo de 1997 los laboratorios Dolby anunciaron la creación del primer software capaz de descodificar los 5.1 canales Dolby Digital de un DVD-ROM y crear sonido envolvente con sólo dos altavoces, utilizando un procesador Intel MMX. Para ello se utiliza software RSX 3D de Intel, un programa que sitúa cinco altavoces virtuales alrededor del oyente.
De esta forma la tecnología Dolby Digital también se introduce en el mundo multimedia.

Equipos Dolby Digital (AC-3).



Un gran número de compañías ofrecen productos Dolby Digital, como descodificadores, pre-amplificadores y amplificadores. Entre las compañías más importantes podemos destacar Denon, Pioneer, JBL, Kenwood y Yamaha.
Una de las claves para conseguir un abaratamiento de los equipos, debido a su elevado coste en sus inicios, fue el diseño de circuitos integrados que sean capaces de descodificar AC-3 con un único chip.
La compañía Zoran fue la primera en desarrollar los primeros CI´s AC-3 : el ZR38500 permite descodificar tramas AC-3 y Dolby Pro-Logic para sistemas domésticos, mientras que el ZR38521 descodifica dos canales AC-3 y audio MPEG-1. El ZR38501 descodifica sólo dos canales AC-3 para aplicaciones en Televisión por Cable, DBS o HDTV.
Motorola lanzó más tarde el 56007, un procesador de 24 bits capaz de descodificar AC-3, audio MPEG-2, y el formato ATRAC de Sony. El 56007 es compatible con el CI de Motorola 56004 Symphony, e incorpora todos los periféricos de audio digital disponibles para el 56004, además de tener 12 veces más memoria de programa y 4 veces más memoria de datos.
Yamaha también dispone de DSP’s específicos para Dolby Digital, como el A3090 preparado para descodificar tramas AC-3 para cine.
Uno de los últimos chips Dolby Digital fue lanzado al mercado en Noviembre de 1996 por Crystal Semiconductors : el CS4923 de 24 bits y capaz de realizar 50 MIPS, preparado además para descodificar Dolby Pro-Logic.
LSI y Hewlett Packard continúan con el desarrollo de su descodificador ASIC para televisión por cable. Otras compañías como New Japan Radio Corporation o Texas Instruments han anunciado el desarrollo de CI´s AC-3.
Como ejemplo de un descodificador AC-3 se presenta a continuación el modelo KR-V990D de la casa Kenwood.

6210.gif

Este modelo proporciona 105 W de potencia a los altavoces frontales, y 50 W a los altavoces surround, considerando para todos ellos una impedancia de 8 ohmnios. Además de Dolby Digital, presenta la posibilidad de descodificar Dolby Surround Pro-Logic. Presenta dos terminales de entrada Dolby Digital : entrada RF ( usada en el LaserDisc ) y entrada digital. Los modelos europeos tienen la posibilidad de recepción de RDS.

3.    Descripción General de Dolby Digital:



Dolby Digital es un formato de audio completamente digital, desarrollado inicialmente para su uso en las salas de cine y denominado inicialmente Dolby Stereo Digital, haciendo su aparición por primera vez en 1992 con la película “El regreso de Batman”. La variante para uso doméstico del decodificador Dolby Digital, denominado inicialmente AC-3 (Audio Code 3) o sistema 5.1, ya que utiliza cinco canales más otro canal LFE, también conocido como canal de baja frecuencia. Los canales surround poseen el mismo margen que los canales frontales, de 20Hz (graves) a 20kHz (agudos). El canal de baja frecuencia gestiona todo lo que sean estruendos, graves… En este tipo de sistemas lo normal es tener un Subwoofer para este canal (canal adicional sólo para sonidos graves, que aporta más presencia y relieve al sonido reproducido). Aunque haría falta sería, no sólo un amplificador compatible, sino también un buen juego de altavoces de home cinema. Ello es debido a que el Dolby Digital, en teoría envía la misma cantidad de información tanto para altavoces traseros como para los delanteros, por lo que debemos contar con altavoces de calidad.
Las características extra no sólo se traducen en impresionantes bandas sonoras, sino también en adicionales pistas de idiomas en el mismo disco. Además, el Dolby Digital ha ido más allá con el Dolby Digital Surround EX, un desarrollo conjunto con THX que agrega otro canal de audio a la banda sonora que se sitúa detrás del espectador, lo que proporciona aun mayor profundidad, localización y perfección de sonido.

Características:



- Es el formato adoptado universalmente como obligatorio por el DVD Forum para el apartado audio de las películas en formato DVD.
- Puede incluir hasta un total de cinco canales discretos (totalmente independientes) más un canal para efectos de muy baja frecuencia (LFE). De ahí su apelativo de 5.1. Ello aporta una separación entre canales comprendida entre 70-80 dB contra los 35-37 del Dolby Pro-Logic y una mejora en la gama dinámica.
- Es frecuente asociar Dolby Digital con 5.1 canales, pero también puede ser mono (1.0), estéreo (2.0) e incluso cinco canales sin Subwoofer, es decir 5.0.
- Cada uno de los cinco canales principales, delanteros (izquierda y derecha), central y traseros (izquierda y derecha), son de rango completo, de 20Hz a 20kHz. Al canal LFE (subwoofer) se le reservan las frecuencias entre 20 y 120 Hz.
- Emplea una tasa de compresión de datos de 10-12 a 1 y una velocidad de transferencia de 384 kilobits por segundo para codificación en 5.1 canales. El anterior ratio de transferencia supone la tercera parte de los datos necesarios para información codificada en PCM (Modulación por Codificación de Impulsos) dos canales. Precisamente esta compresión de datos es la mayor crítica que se le puede hacer a Dolby Digital para la reproducción de música.
- Es compatible hacia atrás con Dolby Surround mediante técnicas de remezclado, convirtiendo todos los canales a Dolby Surround (analógico, dos canales). De este modo, el sonido de una película en DVD con Dolby Digital 5.1 puede escucharse en un televisor estéreo o mono, e incluso atacar a un Dolby Pro-Logic externo ya que la codificación Dolby Surround estará presente en las salidas analógicas, tanto por Euroconector o Scart como por los terminales estéreo RCA del lector de DVD.

4.    Dolby Prologic:



A finales de los 80 Dolby dio el gran salto con los revolucionarios Dolby Surround y luego el Dolby Pro-Logic, que permitieron llevar al hogar por primera vez el sonido de cuatro canales(un canal central, dos frontales y un dos traseros monos) que se disponía en las salas de cine, para disfrutar de las películas en VHS y Láser.
Ya a principios de los años 90  Dolby volvió a revolucionar el mundo de la cinematografía con un nuevo desarrollo, apto no solo para las más modernas salas de cine, sino también el video hogareño, el “AC-3″, rebautizado luego como “Dolby Digital”, ya que por primera vez, el sistema era completamente digital.
Dolby Digital, es el siguiente paso evolutivo por encima de Dolby Pro-Logic, después de treinta años de desarrollo ininterrumpido. El sistema Dolby Digital permite disponer de seis canales de sonido totalmente independientes.
Al igual que Dolby Surround, el Pro-Logic incluye canales izquierdo, central y derecho para posicionar altavoces en una habitación. El Dolby Surround Pro-Logic proporciona además de un único canal de sonido surround (envolvente) con un ancho de banda limitado (de 100 Hz a 7.000 Hz) que generalmente se reproduce a través de dos canales de amplificación y dos altavoces(ambos monoaurales).
En comparación, Dolby Digital proporciona canales izquierdo y derecho de sonido envolvente SEPARADOS(y stereos), para crear un ambiente de localización más preciso y convincente. Con Dolby Digital, los cinco canales principales son de ancho TOTAL (de 20  a 20,000 Hz). Se puede añadir también un sub-woofer(que proporciona el sonido mas grave) en cada canal si se desea, pero lo normal es que se utilice un solo sub-woofer.

Con la configuración standard de 5.1 canales, Dolby Digital otorga una sensación envolvente de calidad superior a todo lo conocido hasta la fecha
Esta configuración, conocida también como 5.1(5 canales, más el sub-woofer, todos activos) tiene como mayor ventaja, el direccionamiento especifico de cada frecuencia a cada altavoz especifico(voces en el central, generales en los dos frontales, “envolventes” en los dos surround(ambos con señales stereo) y los sonido más graves en el sub-woofer.

Utilizado inicialmente en los Láser Disc, cuando el DVD finalmente salió al ruedo, se eligió al Dolby Digital como el sistema de sonido oficial del formato, otorgándole un increíble realismo.

5.    Diferencias entre DOLBY PRO-LOGIC y DOLBY DIGITAL:



Tanto el Dolby Pro-Logic como el Dolby Digital nacieron del trabajo de los laboratorios Dolby en el campo de la industria cinematográfica. Ambas tecnologías proporcionan una impactante sensación de espacialidad. A pesar de ser más antigua, Dolby Pro-Logic es la elegida para las emisiones de televisión y videocasetes actuales. El Dolby Digital una incorporación relativamente reciente, es el nuevo estándar de audio para el DVD. Algunas de las diferencias son:
- Dolby Digital es completamente digital. El Pro-Logic es esencialmente una tecnología analógica a pesar de que algunos decodificadores utilizan técnicas de Procesado Digital de Señal (DSP) para optimizar la información direccional.
- Dolby Digital es discreto (canales completamente separados) mientras que el Pro-Logic posee una estructura matricial (canales combinados). Esto significa que el Dolby Digital elimina el cruce entre canales. En teoría, el resultado es una mejor localización y una imagen sonora más específica que en el Pro-Logic.
- Dolby Digital contiene canales de efectos estereofónicos, mientras que el Pro-Logic posee un único canal de efectos a pesar de que el mismo sea casi siempre reproducido a través de dos cajas acústicas.
- Cada uno de los canales de efectos del Dolby Digital puede transportar la totalidad de frecuencias de audio, mientras que en el Pro-Logic las frecuencias correspondientes al canal de efectos se limitan a la banda 100-7.000 Hz.
- Dolby Digital incluye un canal de graves completamente separado, denominado LFE (Efectos de Baja Frecuencia) del que carece el Pro-Logic. Este canal de graves cubre la banda de 20-120 Hz, incluso la décima parte de la totalidad de la gama de frecuencias de audio (20-20.000 Hz). Esta es la razón de la existencia del “.1″ en “5.1″. Significa simplemente que hay cinco canales de gama completa (Frontal Izquierdo, Frontal Central, Frontal Derecho, Efectos Izquierdo y Efectos Derecho) y uno de efectos de baja frecuencia de gama limitada.

6.    Canales:



Estos son los 6 canales que ofrece el DD:

C:

Un canal, llamado Central (Central Channel), se encuentra detrás de la pantalla (en pantallas proyectadas, como en el cine) o por encima o por debajo (de pantallas de televisión), y se destina a reproducir la mayor parte de los diálogos de la cinta (por esta razón también se le llama Canal de Diálogos o Canal Principal, ya que es el más utilizado).

L,R:

Dos canales, llamados Frontal Izquierdo (Left Front Channel) y Frontal Derecho (Right Front Channel), detrás de la pantalla (proyectada) o a los lados (televisor), proporcionan la acción en pantalla (por eso, junto con el C, reciben el nombre de Canales de Pantalla).

LS,RS:

Dos canales, llamados Posterior Izquierdo (Left Surround) y Posterior Derecho (Right Surround), localizados, en el cine, en las paredes laterales y parte de la trasera (se utilizan una fila de altavoces para ambos canales, a 2 o más metros de altura) y, en el caso doméstico, se sitúan dos únicos altavoces a los lados del espectador, a 20º por detrás de su horizontal. Estos canales son utilizados para definir un ambiente sonoro tridimensional que envuelva (surround) al espectador (también se llaman Canales de Ambiente o de Efectos).

LFE:

Un canal, llamado Canal de Frecuencias o Efectos Bajos (Low Frequency Effects) es utilizado para reproducir las frecuencias más bajas que los otros altavoces no pueden reproducir. Su colocación en el cine es detrás de la pantalla y al lado o por debajo de los altavoces principales, y en casa es bastante libre (ya que en los límites del espectro el oído humano no localiza bien la fuente de los sonidos), siendo recomendable su colocación a nivel de suelo (si sitúa en una esquina es mayor su amplitud al rebotar las ondas en las paredes y en el suelo)
Los canales L, C, R, RS y LS tienen los cinco el mismo rango de frecuencias, de 20 Hz a 48 kHz, mientras que el del LFE va de  20Hz a 120 Hz.

6211.gif

En realidad el LFE no es un canal íntegro, sino que se le considera un canal de refuerzo que no es necesario (en cine sí lo es) pero sí altamente recomendado. Por eso cuando una grabación en AC3 contiene los 6 canales no se le llama DD 6, sino DD 5.1, donde el “punto 1″ representa el canal de graves; del mismo modo, cuando este canal no está presente se indica con la terminología DD 5.0. A pesar de esto la mayoría de amplificadores domésticos compatibles con Dolby Digital (curiosamente más los de gama baja y media que los de alta), cuando detectan una señal AC3 sin LFE se encargan de filtrar las frecuencias bajas de los otros cinco canales y enviárselas al subwoofer (altavoz de subgraves). La razón por la que los decodificadores de gama alta no lo hacen es porque en cierta manera esto deforma el sonido original y el resultado no es tan puro, aunque muy realista.

En el Cine



En las películas cinematográficas, los datos del Dolby Digital vienen integrados directamente en la cinta. Se encuentran en el lateral izquierdo del filme (mirando hacia pantalla), concretamente impresas en los espacios que hay entre los orificios por donde el proyector arrastra la cinta (hay 4 agujeros por fotograma en cinta de 35 mm). La representación impresa de los datos del Dolby Digital son píxels negros y transparentes, y en el centro de cada cuadro hay el logotipo de la doble-D (que no contiene datos).
Para leer estos datos digitales el proyector tiene que estar equipado con un LED (diodo emisor de luz), con una vida útil de unas 10.000 horas, que pasa por los bloques y proyecta la imagen en un dispositivo fotosensible que la capta y analiza, convirtiéndola en señal eléctrica binaria, que se envía al decodificador Dolby Digital para transformarla en sonido multicanal y amplificarla.
6212.gif

Situación de la trama Dolby Digital en cintas de cine.



Para que el lector pueda interpretar bien los datos la superficie de la cinta tiene que estar limpia, ya que cualquier partícula ajena a la cinta puede causar errores de lectura. Para asegurar la correcta lectura cada bloque se escanea tres veces, y el sistema escoge la imagen más limpia. El tiempo también deteriora la cinta, y por tanto cada vez se producen más errores de lectura durante la proyección; de hecho es muy probable que se produzcan errores de lectura, pero el decodificador ya está preparado:
La señal contiene un 50% de datos redundantes como sistema de seguridad. Además, cuando el decodificador se encuentra con uno, dos o hasta tres bloques de datos contiguos ilegibles, se repite en lugar de éstos, el último bloque decodificado correctamente. El oído humano no nota esta repetición (correspondiente a 1/96 parte de segundo por bloque), pero sí notaría un corte sin sonido. Pero cuando el número de bloques contiguos erróneos es igual o superior a cuatro, el sistema cambia automáticamente a la pista analógica Dolby SR, siempre integrada en la cinta. Si los siguientes bloques siguen siendo ilegibles el sistema pasa a Long Revert Mode (Modo de Reversión Larga), y continua reproduciendo la pista analógica durante 30 segundos más antes de volver a intentar decodificar la digital. Así que en un cine Dolby Digital se están leyendo constantemente ambas pistas, la digital y la analógica, por si falla.
El momento del cambio de digital a analógico se puede identificar fácilmente, ya que normalmente suena un fuerte estallido agudo, debido al cambio de programa en el proceso digital del decodificador; pero con este sistema de seguridad la sala nunca se queda sin sonido. Además, en el hipotético caso de fallo en el proceso del SR, se puede pasar a pista Dolby A-Type, también presente en todos los procesadores, o a Mono como ultima alternativa.
Otro sistema de seguridad de que están dotados los procesadores cinematográficos Dolby es el sistema de Bypass. Si la corriente principal falla, el sistema pasa a Bypass Mode, o si se produce un error interno en la circuitería que pudiera poner en peligro la señal de salida. Este sistema permite seguir decodificando los datos, pero en vez de amplificar y enviar los 6 canales a sus altavoces correspondientes , solo utiliza una tarjeta amplificadora, mandando los 6 canales de audio a los altavoces de pantalla, resultando en una señal monoaural. El sistema es automático, pero también se puede activar manualmente en caso de que, por ejemplo, un altavoz imprescindible falle.
Los decodificadores cinematográficos Dolby son evolucionables, es decir, si en algún momento hay algún aspecto de las pistas que cambia, para adaptar a los decodificadores se incluye el software en el principio de la cinta que requiere esos cambios, desde donde se cargará y actualizará. De esta manera el firmware del procesador se actualiza automáticamente sin necesidad de asistencia técnica.


La Codificación del Dolby Digital:



El estándar del CDDA (Compact Disc Digital Audio) utiliza el sistema de sonido PCM (Pulse Code Modulation), con 16 bits de profundidad y 44.1 kHz; es decir, que cada segundo de cada canal (2 en CDDA) contiene 44100 muestras de sonido, cada una de ellas constituida por 16 bits. Estas características permiten que el Dynamic Range (rango dinámico) sea de 96 dB desde el sonido más fuerte hasta el ruido de fondo (ruido nulo en el caso teórico perfecto). Cuantos menos bits se utilicen en una muestra para definir sonido, más reducido es el rango dinámico, y por tanto más alto el volumen de ese ruido de fondo.
Aquí es donde el sistema de reducción de ruido Dolby NR (Noise Reduction) es básico para entender la codificación del AC3. Se aprovecha del fenómeno psicoacústico de enmascaramiento de frecuencias, por el que el ser humano no puede diferenciar más de un sonido de la misma frecuencia, sino que sólo oímos el de mayor amplitud (el que enmascara los otros). En el DD se reduce el ruido de fondo (provocado por la escasez de bits) cuando no hay sonido en dicho rango de frecuencias, y cuando sí lo hay sólo se reducen los ruidos de las frecuencias que quedan tapadas por el sonido principal (por el efecto de enmascaramiento).
Dolby Digital codifica el sonido dividiendo el espectro sonoro en estrechas bandas de frecuencia de diferentes anchuras, optimizadas respecto a la selección del oído humano. Esto permite filtrar apuradamente el espectro de frecuencias, evitando que el ruido audible debido al bajo flujo de bits sea diferenciable, sólo percibiendo (con instrumentación, no a simple oído) el ruido que queda cercano a la frecuencia seleccionada. Un codificador Dolby Digital permite seleccionar esta anchura de banda de frecuencia (kHz).
Como se ha explicado, el flujo total de datos digitales del DD es constante, pero no lo es cada canal por separado; la llamada agrupación de bits permite que los canales que “reclaman” más definición porque contienen un espectro más amplio o un volumen más elevado (como puede ser el canal de diálogos mientras los surround permanecen en silencio), reciban un flujo de bits más elevado que los otros canales que no lo requieran. Esto pasa constantemente, ya que nunca reciben en una grabación sonora la misma gama y el mismo nivel de sonido todos los canales por igual, por tanto podemos decir que el Dolby Digital es un sistema de flujo total constante formado por flujos individuales variables que se compensan para mantener siempre el mismo bit-rate. Otro caso donde la agrupación de bits es muy útil es a la hora de representar dos canales diferentes con la misma información contenida; mientras que otros sistemas digitales tienen que codificar cada señal por separado (repitiendo gran cantidad de información), el DD también busca ligeramente parecidos entre canales, para poder ahorrar información y ser aprovechada por otros canales más necesitados (recordemos que hay un “límite” de capacidad que se tiene que cumplir con exactitud).

7.    El Algoritmo de Codificación Dolby AC-3:



Dolby AC-3 es el sucesor de otros dos sistemas de codificación perceptiva - Dolby AC-1 y Dolby AC-2 - y ha sido diseñado para aprovechar al máximo el enmascaramiento temporal y frecuencial que caracteriza a la audición humana, codificando las componentes frecuenciales del sonido en lugar de su característica temporal. Para ello cada canal es filtrado en pequeñas bandas de diferentes tamaños antes de ser codificado, tratando así de imitar el comportamiento del oído humano; con esto conseguimos que las componentes frecuenciales del sonido y su correspondiente ruido de cuantificación queden dentro de una misma banda, con lo que se consigue un mejor aprovechamiento de las características de enmascaramiento del oído humano, minimizando así la tasa de bits necesaria para una codificación libre de ruido.
Reduciendo o eliminando el ruido de cuantificación donde no haya señal que lo enmascare la calidad del sonido no se verá afectada.
El algoritmo Dolby AC-3 distribuye los bits con que se cuantificarán las componentes frecuenciales de las diferentes bandas teniendo en cuenta las características espectrales de la señal codificada. Un modelo interno que simula el enmascaramiento frecuencial y temporal del oído permite al codificador variar su resolución espectral-temporal dependiendo de la naturaleza del sonido, de forma que se asegure un número mínimo de bits para describir la señal en cada banda garantizando que el ruido quede totalmente enmascarado. Este modelo de enmascaramiento frecuencial hace que aquellas componentes espectrales del sonido que vayan a quedar enmascaradas por otras no sean codificadas. AC-3 también distribuye los bits entre los diferentes canales de manera que se consiga  una tasa de bits estable, asignando más bits a los canales con un mayor contenido frecuencial.
Como se puede apreciar el modelo de enmascaramiento y el algoritmo de distribución de bits son factores clave en la gran eficiencia espectral del sistema.
El algoritmo AC-3 considera los seis canales como una entidad única incluyéndolos en una única trama de bits, con lo que se consigue una tasa de bits menor que separando cada canal en una trama distinta.
Otra característica a destacar del sistema AC-3 es su gran versatilidad, permitiendo frecuencias de muestreo de 32, 44.1 y 48 kHz y velocidades de transmisión de entre 32 kb/s, para un único canal mono, hasta 640 kb/s, cuando el sistema trabaja a su máxima capacidad. La velocidad de transmisión en un sistema Dolby Digital doméstico de 5.1 canales es de 384 kb/s y de 192 kb/s para sistemas de dos canales.

8.    Diagrama de Bloques del Codificador AC-3:



A continuación se describen los diferentes bloques que conforman un codificador AC-3, prestando especial atención a los conceptos de enmascaramiento temporal y frecuencial y cómo son utilizados por el codificador para obtener una gran compresión sin pérdida de calidad.
El diagrama de bloques del codificador es el siguiente :
6213.gif

Situación de la trama Dolby Digital en cintas de cine.


Para que el lector pueda interpretar bien los datos la superficie de la cinta tiene que estar limpia, ya que cualquier partícula ajena a la cinta puede causar errores de lectura. Para asegurar la correcta lectura cada bloque se escanea tres veces, y el sistema escoge la imagen más limpia. El tiempo también deteriora la cinta, y por tanto cada vez se producen más errores de lectura durante la proyección; de hecho es muy probable que se produzcan errores de lectura, pero el decodificador ya está preparado:
La señal contiene un 50% de datos redundantes como sistema de seguridad. Además, cuando el decodificador se encuentra con uno, dos o hasta tres bloques de datos contiguos ilegibles, se repite en lugar de éstos, el último bloque decodificado correctamente. El oído humano no nota esta repetición (correspondiente a 1/96 parte de segundo por bloque), pero sí notaría un corte sin sonido. Pero cuando el número de bloques contiguos erróneos es igual o superior a cuatro, el sistema cambia automáticamente a la pista analógica Dolby SR, siempre integrada en la cinta. Si los siguientes bloques siguen siendo ilegibles el sistema pasa a Long Revert Mode (Modo de Reversión Larga), y continua reproduciendo la pista analógica durante 30 segundos más antes de volver a intentar decodificar la digital. Así que en un cine Dolby Digital se están leyendo constantemente ambas pistas, la digital y la analógica, por si falla.
El momento del cambio de digital a analógico se puede identificar fácilmente, ya que normalmente suena un fuerte estallido agudo, debido al cambio de programa en el proceso digital del decodificador; pero con este sistema de seguridad la sala nunca se queda sin sonido. Además, en el hipotético caso de fallo en el proceso del SR, se puede pasar a pista Dolby A-Type, también presente en todos los procesadores, o a Mono como ultima alternativa.
Otro sistema de seguridad de que están dotados los procesadores cinematográficos Dolby es el sistema de Bypass. Si la corriente principal falla, el sistema pasa a Bypass Mode, o si se produce un error interno en la circuitería que pudiera poner en peligro la señal de salida. Este sistema permite seguir decodificando los datos, pero en vez de amplificar y enviar los 6 canales a sus altavoces correspondientes , solo utiliza una tarjeta amplificadora, mandando los 6 canales de audio a los altavoces de pantalla, resultando en una señal monoaural. El sistema es automático, pero también se puede activar manualmente en caso de que, por ejemplo, un altavoz imprescindible falle.
Los decodificadores cinematográficos Dolby son evolucionables, es decir, si en algún momento hay algún aspecto de las pistas que cambia, para adaptar a los decodificadores se incluye el software en el principio de la cinta que requiere esos cambios, desde donde se cargará y actualizará. De esta manera el firmware del procesador se actualiza automáticamente sin necesidad de asistencia técnica.

La Codificación del Dolby Digital:


El estándar del CDDA (Compact Disc Digital Audio) utiliza el sistema de sonido PCM (Pulse Code Modulation), con 16 bits de profundidad y 44.1 kHz; es decir, que cada segundo de cada canal (2 en CDDA) contiene 44100 muestras de sonido, cada una de ellas constituida por 16 bits. Estas características permiten que el Dynamic Range (rango dinámico) sea de 96 dB desde el sonido más fuerte hasta el ruido de fondo (ruido nulo en el caso teórico perfecto). Cuantos menos bits se utilicen en una muestra para definir sonido, más reducido es el rango dinámico, y por tanto más alto el volumen de ese ruido de fondo.
Aquí es donde el sistema de reducción de ruido Dolby NR (Noise Reduction) es básico para entender la codificación del AC3. Se aprovecha del fenómeno psicoacústico de enmascaramiento de frecuencias, por el que el ser humano no puede diferenciar más de un sonido de la misma frecuencia, sino que sólo oímos el de mayor amplitud (el que enmascara los otros). En el DD se reduce el ruido de fondo (provocado por la escasez de bits) cuando no hay sonido en dicho rango de frecuencias, y cuando sí lo hay sólo se reducen los ruidos de las frecuencias que quedan tapadas por el sonido principal (por el efecto de enmascaramiento).
Dolby Digital codifica el sonido dividiendo el espectro sonoro en estrechas bandas de frecuencia de diferentes anchuras, optimizadas respecto a la selección del oído humano. Esto permite filtrar apuradamente el espectro de frecuencias, evitando que el ruido audible debido al bajo flujo de bits sea diferenciable, sólo percibiendo (con instrumentación, no a simple oído) el ruido que queda cercano a la frecuencia seleccionada. Un codificador Dolby Digital permite seleccionar esta anchura de banda de frecuencia (kHz).
Como se ha explicado, el flujo total de datos digitales del DD es constante, pero no lo es cada canal por separado; la llamada agrupación de bits permite que los canales que “reclaman” más definición porque contienen un espectro más amplio o un volumen más elevado (como puede ser el canal de diálogos mientras los surround permanecen en silencio), reciban un flujo de bits más elevado que los otros canales que no lo requieran. Esto pasa constantemente, ya que nunca reciben en una grabación sonora la misma gama y el mismo nivel de sonido todos los canales por igual, por tanto podemos decir que el Dolby Digital es un sistema de flujo total constante formado por flujos individuales variables que se compensan para mantener siempre el mismo bit-rate. Otro caso donde la agrupación de bits es muy útil es a la hora de representar dos canales diferentes con la misma información contenida; mientras que otros sistemas digitales tienen que codificar cada señal por separado (repitiendo gran cantidad de información), el DD también busca ligeramente parecidos entre canales, para poder ahorrar información y ser aprovechada por otros canales más necesitados (recordemos que hay un “límite” de capacidad que se tiene que cumplir con exactitud).

7.    El Algoritmo de Codificación Dolby AC-3:



Dolby AC-3 es el sucesor de otros dos sistemas de codificación perceptiva - Dolby AC-1 y Dolby AC-2 - y ha sido diseñado para aprovechar al máximo el enmascaramiento temporal y frecuencial que caracteriza a la audición humana, codificando las componentes frecuenciales del sonido en lugar de su característica temporal. Para ello cada canal es filtrado en pequeñas bandas de diferentes tamaños antes de ser codificado, tratando así de imitar el comportamiento del oído humano; con esto conseguimos que las componentes frecuenciales del sonido y su correspondiente ruido de cuantificación queden dentro de una misma banda, con lo que se consigue un mejor aprovechamiento de las características de enmascaramiento del oído humano, minimizando así la tasa de bits necesaria para una codificación libre de ruido.
Reduciendo o eliminando el ruido de cuantificación donde no haya señal que lo enmascare la calidad del sonido no se verá afectada.
El algoritmo Dolby AC-3 distribuye los bits con que se cuantificarán las componentes frecuenciales de las diferentes bandas teniendo en cuenta las características espectrales de la señal codificada. Un modelo interno que simula el enmascaramiento frecuencial y temporal del oído permite al codificador variar su resolución espectral-temporal dependiendo de la naturaleza del sonido, de forma que se asegure un número mínimo de bits para describir la señal en cada banda garantizando que el ruido quede totalmente enmascarado. Este modelo de enmascaramiento frecuencial hace que aquellas componentes espectrales del sonido que vayan a quedar enmascaradas por otras no sean codificadas. AC-3 también distribuye los bits entre los diferentes canales de manera que se consiga  una tasa de bits estable, asignando más bits a los canales con un mayor contenido frecuencial.
Como se puede apreciar el modelo de enmascaramiento y el algoritmo de distribución de bits son factores clave en la gran eficiencia espectral del sistema.
El algoritmo AC-3 considera los seis canales como una entidad única incluyéndolos en una única trama de bits, con lo que se consigue una tasa de bits menor que separando cada canal en una trama distinta.
Otra característica a destacar del sistema AC-3 es su gran versatilidad, permitiendo frecuencias de muestreo de 32, 44.1 y 48 kHz y velocidades de transmisión de entre 32 kb/s, para un único canal mono, hasta 640 kb/s, cuando el sistema trabaja a su máxima capacidad. La velocidad de transmisión en un sistema Dolby Digital doméstico de 5.1 canales es de 384 kb/s y de 192 kb/s para sistemas de dos canales.

8.    Diagrama de Bloques del Codificador AC-3:



A continuación se describen los diferentes bloques que conforman un codificador AC-3, prestando especial atención a los conceptos de enmascaramiento temporal y frecuencial y cómo son utilizados por el codificador para obtener una gran compresión sin pérdida de calidad.
El diagrama de bloques del codificador es el siguiente :
6214.gif

Efectividad del enmascaramiento temporal de un tono.



Como se desprende de la figura, para que una señal sea capaz de enmascarar un ruido que aparece con anterioridad no debe haber una diferencia temporal superior a 10 ms.
Por lo tanto, en presencia de transitorios el tamaño del bloque se debe ajustar de tal forma que el pre-ruido de cuantificación aparezca dentro de la zona temporal en la que pueda ser enmascarado por la señal codificada.
El tamaño del bloque también es función de la frecuencia del transitorio, cumpliéndose que cuanto mayor sea la frecuencia menor deberá ser el tamaño del bloque.
En  la siguiente figura se compara el resultado de codificar el ataque de una castañuela ( A ) a 128 kb/s utilizando un bloque de longitud fija 512 muestras ( B ) y un bloque adaptativo ( C ).
6215.gif
Señal de una castañuela. (A) Original, (B) Codificado a 128 kb/s con un Codificador de longitud fija de 512 muestras, (C) Codificado a 128 kb/s con Codificador de  longitud variable.

Como se puede ver el ruido de cuantificación previo al ataque de la castañuela es mucho menor en C que en B.
Cuando la señal a codificar tiene carácter estacionario el tratamiento debe se distinto; en este caso se busca una buena resolución espectral, lo que supone un tamaño de bloque mayor.
Se ha impuesto una limitación a las variaciones de tamaño que pueden sufrir los bloques con el fin de facilitar el proceso de codificación; se permiten ocho combinaciones distintas de cuatro tipos de ventana. Cada una de las ocho combinaciones se identifica con un Cuadro I.D. El descodificador debe conocer en todo momento el tipo de Cuadro I.D. que se está utilizando en el análisis de la señal, por lo que esta información se multiplexa junto con los coeficientes que describen la señal. La información del Cuadro I.D. utilizado junto con su protección contra errores constituye el 1% de la tasa de bits total.
En la siguiente figura tenemos un ejemplo de cómo varía el tamaño del enventanado, según se necesite resolución temporal o frecuencial.

6216.gif

Secuencia típica de variación del enventanado para señales de entrada que requieren gran resolución temporal.

El banco de filtros TDAC:



La señal de entrada de cada canal es enventanada y filtrada con el banco de filtros TDAC de forma individual. La transformada TDAC es una FFT modificada que ofrece una baja complejidad computacional con una buena selectividad frecuencial, lo que simplifica el hardware.
La respuesta en frecuencia del banco de filtros TDAC varía según el tamaño del enventanado previo de la señal a analizar tal y como se muestra en la figura:

A)

6217.gif

B)

6218.gif
C)

6219.gif

Respuesta en frecuencia del Banco de Filtros.



La mayoría del tiempo el banco de filtros trabaja con su máxima resolución frecuencial ( A ) ; en presencia de transitorios el banco de filtros emplea mayor resolución temporal ( B ), mientras que en las regiones de transición la respuesta del filtro es la de ( C ).
A partir de aquí el procesado se lleva a cabo sobre los coeficientes obtenidos de la transformada TDAC de los 5.1 canales, que serán tratados como una única entidad (sólo los  coeficientes del canal de graves no son procesados antes de ser transmitidos).
En el descodificador se reconstruyen las señales en el tiempo aplicando la transformada inversa TDAC a estos coeficientes. Para evitar discontinuidades en las señales se utiliza un solapado del 50% de los bloques en los procesos de análisis y síntesis.
La ganancia de compresión del sistema se obtiene principalmente de seleccionar para cada coeficiente el número de bits con el que será codificado, según la importancia de cada coeficiente en la descripción de la señal. Para realizar esto se tendrá en cuenta el modelo de enmascaramiento frecuencial del oído. Mientras este proceso de codificación no elimine o añada información audible, la salida del descodificador nos parecerá que suena igual que la entrada del codificador.


Conversión a punto flotante:



Aunque el sistema esté implementado con DSP´s de punto fijo (por razones de precio), los coeficientes de la transformada TDAC se convierten a punto flotante para el posterior procesado, con mantisas que varían entre 0.5 y 1 y sus correspondientes exponentes. De esta forma se asegura que las siguientes etapas no impongan limitaciones al rango dinámico de las señales, usando tantos factores de escala como se necesiten entre la entrada y la salida de datos. Con todo esto el algoritmo AC-3 conserva las ventajas de resolución que ofrecen los conversores A/D y D/A de 18-20 bits.

Precombinación de portadora:


En general la tasa media de bits en sistemas multicanal es directamente proporcional a la raíz cuadrada del número de canales. Si utilizamos 128 kb/s para codificar un único canal, una cantidad de 5.1 canales necesitará 128  = 289 kb/s que se pueden transmitir con comodidad utilizando la velocidad típica de trabajo del AC-3 ( 320 kb/s ). Por ello la mayoría de las veces será suficiente utilizar como método de compresión el algoritmo de asignación de bits. Sin embargo, cuando sea necesaria una mayor compresión se utiliza también el método de precombinación de portadora.
Esta técnica elimina información redundante de alta frecuencia, y se basa en el fenómeno psicoacústico de que en altas frecuencias la audición humana es más sensible a la “envolvente” del sonido que a la señal en sí.
Este comportamiento es aprovechado por el AC-3 separando las señales de alta frecuencia en portadora y envolvente, de forma que la información de la envolvente sea codificada con mayor precisión que la portadora.
El impacto auditivo es mínimo, puesto que la localización del sonido queda registrada en la envolvente, la cual se combinará acústicamente en el oído produciendo un efecto equivalente al del sonido original.
La información de la portadora incrementa las mantisas y exponentes de los coeficientes TDAC, mientras que la información de la envolvente se registra en un vector de Coeficientes Acoplados.

Asignación de bits:



La principal ventaja de la codificación multicanal en una única trama es la posibilidad de distribuir la cantidad de bits con que se cuantificarán las mantisas de las componentes frecuenciales de cada canal, según las características de las señales, el modelo de enmascaramiento frecuencial de la audición humana y la velocidad de transmisión a la que se trabaje.
La cantidad de bits con que se codifica cada mantisa no se transmite de forma explícita, sino que se envía la información necesaria para que el descodificador sea capaz de recalcular el número de bits con que se ha cuantificado cada mantisa, consiguiendo un gran ahorro en la cantidad de bits a transmitir.
Dada la importancia que este proceso tiene en la codificación AC-3 lo analizaremos con más detalle. El diagrama de bloques es el siguiente :

6220.gif

En primer lugar se obtiene el espectro de potencia de la señal a codificar a partir de los coeficientes de la transformada TDAC.
El siguiente paso es la integración de las muestras del espectro de potencia, tomadas a intervalos equidistantes de frecuencia, en bandas de diferente ancho, tal y como lo haría el oído. Esto se consigue dividiendo el espectro de potencia en múltiples bandas sintonizadas a diferentes frecuencias y sumando los valores del espectro de potencia dentro de cada banda.
Los diferentes anchos de cada banda, así como su frecuencia central, son una modificación de las Bandas Críticas definidas por Zwicker.

La figura siguiente, muestra la relación entre la estructura de bandas del AC-3 y las Bandas Críticas de Zwicker para una frecuencia de muestreo de 48 kHz. AC-3 utiliza un total de 50 bandas, que van desde los 0 a los 24 kHz ; hasta los 2440 Hz ( banda 24 ) el ancho de banda es constante e igual a 94 Hz. A partir de entonces el ancho de banda se incrementa 3, 6, 12 y hasta 24 veces, de tal forma que a medida que la frecuencia crece los anchos de banda varían entre 3/4  y 1/4 de los Anchos de Banda Críticos.
La misma estructura de bandas puede ser utilizada para frecuencias de muestreo de 44.1 kHz y 32 kHz.
6224.gif
Subdivisión de los coeficientes TDAC en bandas para el cálculo de la curva de enmascaramiento para una frecuencia de muestreo de 48 kHz.
A continuación se calculará una función de excitación que será el primer paso para la determinación de la curva de enmascaramiento, cuya información será imprescindible en el algoritmo de asignación de bits.
Para el cálculo de la función de excitación se tienen en cuenta los estudios de Fielder y Ehmer en el campo del enmascaramiento frecuencial, que presentaban características del enmascaramiento del oído para las frecuencias 0.02, 0.05, 0.1, 0.2, 0.25, 0.5, 1, 2, 4 y 8 kHz, para niveles de intensidad entre 41 y 101 dB. De estos estudios se desprenden resultados como los de la figura 7, en las que se representa la variación en frecuencia del umbral de audición en presencia un tono de 1kHz.

6225.gif
Curvas de enmascaramiento para un tono de 1 kHz  con valores de intensidad entre 41 y 101 dB.

La figura muestra una nula variación en el umbral de audición en bajas y altas frecuencias y una región central con un significante decremento de la sensibilidad. La mayor reducción está centrada alrededor de la banda crítica de frecuencia la de la señal enmascarante. Cuanto mayor es el nivel de la señal enmascarante, la reducción de sensibilidad afecta a frecuencias más altas, mientras que el enmascaramiento en frecuencias inferiores a la de la señal enmascarante permanece prácticamente constante.
Puesto que la función de excitación se tendrá que expresar en relación al nivel de la señal de entrada, las curvas de enmascaramiento antes presentadas se normalizan con respecto a su nivel de intensidad, obteniéndose resultados como el de la figura siguiente, en la que se muestra la normalización de estas curvas para un tono de 2 kHz.

A continuación se construye una curva de enmascaramiento compuesta calculando el mínimo de cada uno de los cuatro umbrales de enmascaramiento para cada frecuencia.

6226.gif

Curvas de enmascaramiento normalizadas para 40-100 dB de intensidad.

La línea gruesa representa la curva de enmascaramiento compuesta.
Aplicamos el mismo procedimiento al resto de las frecuencias enmascarantes antes citadas, obteniendo un conjunto de 10 curvas compuestas.
Finalmente, las curvas compuestas de todas las frecuencias enmascarantes se convierten en una única función que representa el peor caso de enmascaramiento. Esto se hace representando las diferentes curvas compuestas en una escala de frecuencias relativa a los índices de las bandas AC-3, en la que el índice cero representa la banda de  frecuencia igual a la de la señal enmascarante, seleccionando entonces los valores que más se acerquen a la curva de peor caso.
Para cada banda aparecerá una curva compuesta, según la energía de dicha banda obteniéndose la función de excitación como combinación de las  todas las curvas.  Esta función se compara con el umbral de audición en condiciones normales, obteniendo así la definitiva curva de enmascaramiento que se utilizará para determinar la asignación de bits.
La curva de enmascaramiento se aproxima mediante dos segmentos con diferentes pendientes y niveles de offset, y se define punto a punto como el máximo de ambas curvas a lo largo de la frecuencia.
El primer segmento presenta una mayor pendiente que el segundo, con valores que pueden variar entre -2.95 y -5.77 dB por banda, y con un nivel de offset entre -6 y -48 dB.
La segunda recta presenta una pendiente menos abrupta, que varía entre -0.70 y -0.98 dB por banda, mientras que el offset varía entre -49 y -63 dB.
La figura 9 muestra cómo se aproximan por dos segmentos las curvas de enmascaramiento de cuatro tonos de 0.5, 1, 2 y 4kHz.
6227.gif
Comparación entre las curvas de enmascaramiento para 500 Hz - 4 kHz y su aproximación por dos segmentos.

La sintaxis del AC-3 permite que los parámetros del primer segmento sean independientes para cada canal, mientras que los del segundo serán comunes para todos los canales. En un codificador AC-3 hay hasta 512 funciones de enmascaramiento diferentes.
Para bajas frecuencias existe un tratamiento diferente del enmascaramiento: las frecuencias por debajo de 200 Hz no se tienen en cuenta a la hora de construir la curva de enmascaramiento. Entre 200 y 700 Hz el enmascaramiento sólo se tendrá en cuenta a partir de la componente frecuencial con mayor energía. A partir de 700 Hz todas las bandas de frecuencia se tienen en cuenta para el cálculo de la curva de enmascaramiento.
Una vez se tiene la curva de enmascaramiento comienza el algoritmo de asignación de bits propiamente dicho, en el que se compara el espectro de potencia de la señal a codificar con la curva de enmascaramiento obtenida, de tal forma que aquellos coeficientes con un nivel por debajo de la curva no serán codificados, puesto que no se apreciarían si fueran codificados, con lo que disminuimos el número de bits a transmitir.
En las zonas donde el espectro presenta un mayor valor, la diferencia entre ambas curvas nos indica la relación entre el nivel de señal y ruido de cuantificación que se necesita, asignándose los bits necesarios para igualar o superar esta relación.
Se trata de un proceso de asignación iterativo, en el que tras una asignación inicial se evalúa cómo afecta el ruido de cuantificación de una banda en su vecindad, puesto que existe solapamiento entre bandas. El proceso converge hacia una solución óptima, en la que el ruido de cuantificación debido a todas las bandas queda por debajo de la curva de enmascaramiento.

La figura, muestra un ejemplo en el que un tono de 1 kHz con nivel máximo es codificado de forma que el ruido de cuantificación producido por las bandas 6 a 11 quede por debajo de la curva de enmascaramiento calculada para dicho tono.

6228.gif

Efecto del ruido de cuantificación.



Por último la siguiente figura, ilustra el resultado del algoritmo de asignación de bits para una señal triangular de duración 11 ms. La asignación de bits ha sido convertida a su equivalente nivel S/N ( aproximadamente 6 dB por bit ).

6229.gif

Ejemplo del algoritmo de asignación de bits para una señal triangular.

Tanto el codificador como el descodificador tienen implementado el mismo algoritmo de asignación de bits, aunque es posible incluir en la trama que transmitirá el codificador los parámetros necesarios para que el sistema descodificador haga algunas modificaciones de este algoritmo, dejando abierta la posibilidad de introducir futuras mejoras en el método de asignación.


Cuantificación:



El resultado de la asignación de bits se utiliza para cuantificar las mantisas TDAC. En lugar de enviar los ‘n’ bits más significativos, los valores son escalados y compensados para conseguir niveles de cuantificación centrados en cero, simétricos y de igual ancho (cuantificación simétrica par), para minimizar la distorsión y facilitar el uso de dither sustractivo. En el descodificador se realiza el proceso inverso de compensación para recuperar los valores de las mantisas.
El codificador tiene la opción de añadir dither en el proceso de cuantificación de las mantisas, enviando la información necesaria al descodificador para que conozca el tipo de dither utilizado. El generador de señales pseudoaleatorias se ha diseñado no sólo para que tenga buenas cualidades de aleatorización, sino para que además proporcione idénticos resultados con independencia del tipo de hardware del sistema.

Conformación de la trama:



El proceso anterior convierte cada bloque de 6 canales en una serie de vectores y valores escalares, en los que se incluyen los exponentes TDAC y las mantisas cuantificadas, información sobre la asignación de bits, los coeficientes acoplados e información acerca del dither. En la última etapa del codificador esta información se incluye en un único bloque junto con datos de sincronización, una cabecera y opcionalmente un sistema de corrección de errores.


9.    Diagrama de Bloques del Descodificador AC-3



El siguiente esquema muestra el diagrama de bloques del descodificador AC-3.
6230.gif

Buffer de entrada:



El descodificador, al igual que el codificador, trabaja por bloques por lo que ha de estar sincronizado con la trama de bits de entrada, recogiendo de uno en uno los bloques codificados en el buffer de entrada antes de descodificarlos.

Corrección de errores:



Se comprueba la presencia de errores en la transmisión para cada uno de los bloques de datos de entrada, de forma que si se detecta un error que no se puede corregir el codificador puede usar la última entrada correcta en lugar de la actual para ocultar el error. El solapamiento existente en el proceso de reconstrucción de la señal hace que este sea un buen método para enmascarar errores en la transmisión, haciendo que un mismo bloque se pueda repetir en la salida varias veces si fuera necesario; si el error persistiera el sistema anularía la salida, mientras que en aplicaciones como bandas sonoras para cine se podría pasar a leer las pistas de sonido con información analógica.


Descodificación de los datos con formato fijo:


La descodificación de los datos se lleva a cabo en dos fases. Primero se descodifica los datos cuyo formato es fijo, como son los exponentes, los coeficientes acoplados e información relativa al modo de funcionamiento del descodificador.
Muchos de estos datos son usados por el descodificador para recalcular la asignación de bits hecha por el codificador, necesaria para recuperar los datos con formato variable, principalmente los vectores que contienen las mantisas TDAC.

Cálculo de la asignación de bits:



El algoritmo de asignación de bits en el descodificador es prácticamente idéntico al del codificador, con la salvedad de que usa los resultados intermedios transmitidos para ahorrar tiempo, y opcionalmente modificar el algoritmo de asignación según como indique el codificador. Esto permite al descodificador calcular la asignación de bits de canal en canal, reduciendo las memoria necesaria.
El resultado de este proceso debe ser idéntico al del codificador para que la información con formato variable pueda ser adecuadamente descodificada.

Descodificación de los datos con formato variable:



Una vez recuperada la información acerca de la asignación de bits, en la que se especifica el número de bits con que se codifica cada mantisa, se descodifican los datos con formato variable de la trama de bits transmitida.

Conversión a punto fijo:



Antes de realizar la transformada inversa TDAC, los coeficientes TDAC son pasados de su formato de mantisa y exponente a punto fijo. Si se ha usado dither en el codificador, ahora se sustrae.

Reinserción de la portadora de alta frecuencia:



Los coeficientes de alta frecuencia que hayan sido codificados en forma de portadora y envolvente son reconstruidos combinando las portadoras con sus correspondientes coeficientes acoplados.

Transformada inversa:



Los coeficientes TDAC de cada canal son devueltos al dominio del tiempo mediante la transformación inversa, en la que se utiliza solapamiento de los bloques para obtener las señales digitales de salida.
Los coeficientes a frecuencias medias-altas del canal de graves son puestos a cero, de forma que este canal trabaje a la misma frecuencia que el resto, a pesar de las diferencias en el ancho de banda.

BIBLIOGRAFÍA:



Toda la información con la que se ha elaborado el trabajo ha sido obtenida de Internet :

http://www.dolby.com/professional/motion_picture/faq.html
http://www.dolby.com/resources/tech_library/index.cfm
http://www.video-computer.com/Dolby.htm
http://www.villalbapr.com/aaa1.htm
http://www.villalbapr.com/ac3.htm
http://roble.pntic.mec.es/~ddoncel/Dolbysurround.pdf
http://www.audiolav.com/noticias/dpl2/dpl2.htm
http://www.kenwood.es/sistemas_kenwood_audio_pro1.htm
http://web.interactiva.cl/~fernaadiaz/dvdproject/html/dolby_digital.html
http://www.cybercollege.com/span/tvp042.htm
http://www.iconv.com/usenet/es/pro-audio-faq_enes.htm
http://www.duiops.net/hifi/doldig.html
http://www.geocities.com/cinencasa/dolbyprologic2.htm
http://www.fading.es/contenidos/Dolby.htm
http://ict.pue.udlap.mx/people/raulms/avances/audio.html
http://ict.pue.udlap.mx/people/raulms/avances/codificacion.html

Autor:

Jesus de Yñigo





Creative Commons License
Estos contenidos son Copyleft bajo una Licencia de Creative Commons.
Pueden ser distribuidos o reproducidos, mencionando su autor.
Siempre que no sea para un uso económico o comercial.
No se pueden alterar o transformar, para generar unos nuevos.

 
TodoMonografías.com © 2006 - Términos y Condiciones - Esta obra está bajo una licencia de Creative Commons. Creative Commons License