Canal RSS

Ambisonics como alternativa de sonido inmersivo

Ambisonics como alternativa de sonido inmersivo

En el momento más álgido de la guerra de formatos cuadrafónicos, y entre las voces que discutían a favor y en contra de los sistemas matriciales, Michael Gerzon, del Instituto Matemático de Oxford,  escribíó:

Cuando la estereofonía fue introducida al mercado en los 1950s, había sido sometida a experimentación y estudios teóricos desde 25 años atrás por Fletcher en Estados Unidos, Blumlein en Inglaterra y De Boer en los Paises Bajos. A pesar de una notable anticipación a los sitemas matriciales de cuatro altavoces por parte de Blumlein en 1931, no se ha realizado prácticamente ningún trabajo acerca de sonido envolvente a partir de cuatro altavoces antes de su reciente introducción. Apenas estamos comenzando a entender cómo funciona.

A principios de la década de 1970 un grupo de investigadores británicos independientes, auspiciados por la NRDC, se propuso crear un sistema de verdadero sonido envolvente que compensara los errores y deficiencias de los otros sistemas contemporáneos. En este grupo de investigación estaban el propio Michael Gerzon; el Dr. Peter Barnes Fellgett, del Departamento de Cibernética de la Universidad de Reading y John Stuart Wright de IMF Electronics. Su tecnología se llamaría ‘Ambisonics’, a partir de raices latinas del verbo latino ambire (ir al rededor, rodear) y el sustantivo sonus (sonido)— que denotan sonido envolvente. Ambisonics “permitiría capturar una ejecución musical […] para su transmisión a través de medios de distribución disponibles en el presente o el futuro, para el consumidor, quien podrá reproducirlo en una habitación convencional en el que se recreará el sonido y ambiente acústicos originales, tanto como sea posible.”

¿Cómo funciona Ambisonics?

Ambisonics toma en cuenta los mecanismos de localización de los sonidos del sistma auditivo, que son estudiados por la Psicoacústica, y se basa en estos principios para reproducir las características direccionales de un campo sonoro más allá de las que son posibles obtener por medio del uso de diferencias de amplitud o de fase de una grabación estereofónica convencional; por lo tanto, la principal ventaja de Ambisonics es su capacidad de reproducir un campo sonoro inmersivo, independiente del número y la posición de los altavoces y del escucha. Si bien las ecuaciones que se presentan más adelante hacen referencia a la composición del campo sonoro registrado y reproducido sobre un punto, Ambisonics proporciona el  área de escucha más grande entre cualquier sistema de sonido envolvente actual. Incluso caminando por fuera del arreglo de altavoces el escucha puede apreciar el campo sonoro con buena localización.

Un campo sonoro son todos los sonidos que nos rodean en un espacio delimitado, ya sea real o virtual, en un tiempo determinado. La forma en que Ambisonics captura y reproduce un campo sonoro se basa en la descomposición de dicho campo en sus componentes armónicas esféricas. Matemáticamente, un campo sonoro puede ser considerado como una superposición de ondas planas propagándose perpendicularmente a la superficie de una esfera. Estas ondas a su vez pueden representarse como una serie infinita de funciones armónicas ortogonales de orden M = {0, 1, 2, 3, …, ∞}. A partir de esta consideración es posible proponer un sistema de registro y reproducción de un campo sonoro a partir de la descomposición en funciones armónicas esféricas de las ondas que lo componen; inferir que la resolución de dicho campo será tanta como el orden máximo de las armónicas esféricas que se puedan grabar y reproducir, y proponer que el la grabación y la reproducción sean independientes una de la otra, de tal manera que el número de canales disponibles para ésta no limite la resolución de aquella. El formato ‘básico’ de Ambisonics o Formato B, consiste en las señales W, X, Y y Z, donde  W representa la salida de un micrófono de presión, los canales  X, Y y Z representan la salida de micrófonos de gradiente de presión colocados en los ejes de un espacio tridimensional, con su cara positiva apuntando hacia el frente, la izquierda y arriba, respectivamente. La información registrada por estos canales representa una aproximación al campo sonoro envolvente a partir de sus armónicos esféricos.

Las ecuaciones de estos patrones son:

W=\frac{1}{\sqrt{2}}
X=cos \theta cos \phi
Y=sin \theta cos \phi
Z=sin \phi

donde \theta es el ángulo de azimut y \phi el ángulo de elevación.

En los cuatro canales del sistema, se registra entonces una señal monofónica, que corresponde al armónico esférico de orden cero, más tres armónicas esféricas de primer orden. Gerzon plantea que estos cuatro registros corresponden a la defnición del espacio-tiempo de Minkowski, donde el canal monofónico corresponde al tiempo y los otros canales corresponden al espacio. No solamente pueden ser rotados, sino que también puden ser contraidos o expandidos aplicando las Transformaciones Lorentz, con el efecto de jalar o empujar el campo sonoro. Ésto tiene gran importancia en cuanto a procesamiento, pues hace posible configurar el campo sonoro por medios electrónicos, más allá de lo que podemos hacer con un panpot.

Es posible expandir el sistema a ordenes superiores de armónicas esféricas. En un documento presentado para la AES en 1972, Gerzon sugiere sistemas perifónicos de segundo y tercer órdenes. Así, con Ambisonics de orden n se tiene la posibilidad de reproducir un campo sonoro con tanta presición como canales haya disponibles para definirlo.

Las señales ambisónicas en Formato B pueden ser generadas por medio de controles de panorámica especiales, posibilitando mezclar señales monofónicas en un campo sonoro ambisónico. Adicionalmente, un arreglo tridimensional de micrófonos, el micrófono soundfield se desarrolló para hacer capturas ambisónicas de eventos sonoros. Consiste en cuatro cápsulas de patróon de captación cardioide dispuestas en los vértices de un tetraedro regular, que entregan sus respectivas señales en lo que se conoce como Formato A.

Para convertir la señal de los micrófonos del Formato A al Formato B, es necesario un circuito conocido como ‘Módulo AB’, que consiste en una matriz lineal invariable en el tiempo, tal que resultan las señales:

W=\frac{1}{2}(C_1+C_2+C_3+C_4)
X=\frac{1}{2}(C_1+C_2-C_3-C_4)
Y=\frac{1}{2}(C_1-C_2+C_3-C_4)
Z=\frac{1}{2}(C_1-C_2-C_3+C_4)

Para Ambisonics horizontal, la señal Z es igual a cero, así que puede ser omitida. Una característica significativa de este circuito es que el mismo convierte del Formato B al Formato A, osea que si alimentamos el circuito con las señales W, X , Y y Z en las salidas tendremos las señales correspondientes a C_1C_2C_3C_4.

La forma en que Ambisonics captura y reproduce un campo sonoro se basa en la descomposición de dicho campo en sus componentes armónicas esféricas. Como se ve en la imagen, cuatro cápsulas coincidentes formando un tetraedro registran el campo sonoro en un punto.

La forma en que Ambisonics captura y reproduce un campo sonoro se basa en la descomposición de dicho campo en sus componentes armónicas esféricas. Como se ve en la imagen, cuatro cápsulas coincidentes formando un tetraedro registran el campo sonoro en un punto.

La ‘codificación’ de las señales del Formato B en un medio se llama Formato C, que posteriormente a su desarrollo en la década de 1970 fue conocido como UHJ.

El Formato D consiste en la ‘decodicación’ de señales aptas para excitar un número indeterminado de altavoces. Éste formato, no puede ser estandarizado con precisión, dado que depende necesariamente del número de altavoces y su disposición en torno al escucha.

Las señales del Formato D se obtienen a partir de una combinación lineal de los canales del Formato B, dada por:

P_n=\frac{1}{N}(\sqrt{2W}+kXcos\phi_n+kYsin\theta_ncos\phi_n+kZsin\phi_n)

donde \phi_n \theta_n corresponden a la posición, en coordenadas esféricas, del n-ésimo altavoz y N es el número de canales ambisónicos.

Ambsionics UHJ

Los desarrolladores de Ambisonics crearon un sistema matricial que permite
almacenar material ambisónico en dos canales, manteniendo la información direccional del Formato B en medios compatibles con sistemas estereofónicos y monofónicos.

La BBC estaba experimentando con sonido envolvente y adoptaron el sistema Matrix H para transmisiones experimentales. El equipo de Ambisonics también desarrolló varios sistemas matriciales. Matrix H de la BBC y 45J de los desarrolladores de Ambisonics se combinaron en el sistema Matrix HJ. El trabajo hecho en el sistema cuadrafónico UD-4 (Universal Discrete 4-Channel) de la Nippon Columbia, fue traido al restirador, dando como resultado el sistema UHJ (Universal HJ).

UHJ es un sistema jerárquico de codificación/decodificación de información sonora direccional dentro de la tecnología de Ambisonics. Contiene los canales Q,  T , L y R . Cuando los cuatro canales estén disponibles, el escucha experimentará un campo sonoro tridimensional completo. El canal Q puede ser removido eliminando la información de elevación, y los canales restantes T, L y R proveerán
una imágen horizontal precisa. El canal T puede ser limitado en su ancho de banda, en lo que se conoce como UHJ de 2\frac{1}{2} canales, proporcionando una imágen envolvente con buena localización. Finalmente, con los canales L y R nos queda el —más común— UHJ de dos canales, que se pueden sumar en una señal monofónica.

¿Qué sucedió con Ambisonics?

El 3 de mayo de 1979, el pueblo Británico eligió a Margaret Thatcher, del Partido Conservador, como la pirmer mujer en ocupar el cargo de Primer Ministro. Dispuesta a romper el dominio que ejercían los sindicatos sobre la industria nacional, el gobierno británico impuso el modelo económico neoliberal. Una de las primeras víctimas del nuevo modelo sería el presupuesto para educación, y para 1980, toda la fuerza de ésta política radical diseñada para “corregir” el gasto excesivo en las finanzas públicas, reducir la inflación y liberalizar la economía, comenzó a golpear duramente a organismos públicos descentralizados como la NRDC (Corporación Nacional de Investigación y Desarrollo). Las universidades comenzaron también a sentirse en aprietos cuando sus presupuestos fueron reducidos. La Gran Bretaña de principios de la década de 1980 se encontró en una profunda recesión; el dinero público, que había estado disponible siempre para investigación y desarrollo, comenzó a secarse; la gente de pronto tenía menos y menos dinero para gastar en entretenimeinto y no estaba interesada en gastar el dinero que tenían en novedosos sistemas de cuatro altavoces y cuatro amplificadores, en lugar del ya conocido sistema estéreo de dos altavoces.

La política económica proponía que las innovaciones británicas debían ser financiadas por la industria, y no con dinero público. La reducción del presupuesto provocó la marginación de proyectos como Ambisonics, el cual, aunque prometedor, aún no había regresado ningún rendimiento comercial a la NRDC. Margaret Thatcher creía personalmente que los inventos e innovaciones británicos debían resistir o caer dependiendo de su habilidad para a traer el respaldo de la industria, y tenían que hacerlo sin la ayuda del presupuesto público para impulsarse. Desde luego, en lugar de admitirlo de manera personal, la decisión política fue restringir la NRDC e impedirle hacer su trabajo de manera adecuada, con el fin de desprestigiarla ante la opinión pública —siguiendo la misma línea de instituciones como el Servicio de Salud Nacional.

El siguiente golpe llegó en 1981, con la unión de la NRDC con la Junta Nacional Empresarial (NEB por sus siglas en inglés) para formar un nuevo organismo llamado Grupo Tecnológico Británico (BTG). Desde el principio, sería obvio para los desarrolladores de Ambisonics que el trato con el BTG sería muy diferente al que tenín con la NRDC. Una de las primeras cosas que hizo el BTG fue suspender los sueldosde 6 mil libras anuales de los desarrolladores. Después de haber producido al rededor de 10 patentes, el BTG consideró sus aportaciones como “insignificantes”. En adelante, los desarrolladores serán remunerados en base a honorarios por consultas.

El desarrollo de Ambisonics continuó, no obstante, durante la década de 1980, gracias al trabajo del Dr. Geoffrey Barton, y el grupo de desarrollo del microsistema de Boots/Aiwa —Peter Carbines, George Chkiantz y Riachard Elen— interesado éste último en la mezcla ambisónica a partir de multipistas.

Al respecto del microsistema, Peter Carbines explica:

Aiwa estaba interesado en involucrarse en el mercado británico de la Alta Fidelidad, así que mi acercamiento con ellos tení el objetivo de crear un microsistema de reproducción ambisónico. Comprendimos que aún si la gente compraba el microsistema, todavía estarían en la situación de Catch 22: ¿qué material van a reproducir en él? Aún cuando podía reproducir material estéreo ¿por qué alguien querría pagar el costo extra que significa un sistema envolvente, si no había grabaciones envolventes que reproducir en él, salvo registros especializados y producciones de nicho?

Había álbumes ambisónicos, desde luego: una grabación de Francis Jackson y John Scott Whitley, en el organo de York Minster, hecha por David Malham; Works by Mozart con el Ensamble Albion, y la New Reformation Dixieland Band, grabada en vivo en The Beginings Club, Michigan. El problema con éstas grabaciones es que no eran exactamente atractivas para el mercado masivo.

Sobre una posible estrategia comercial, Richard Elen comenta:

Nuestro punto de vista era que, aunque era posible grabar música en vivo con un micrófono soundfield, y reproducir la sensación de estar ahí, la mayoría de la música lanzada cada semana en discos proveniene de una fuente multipistas mezclada en estéreo. En lugar de mezclar en estereo, pensamos que los ingenieros pueden mezclar con Ambisonics.

La estrategia de tratar de que las compañías discográficas usaran ambisonics era erronea: ya habían tenido su lección con los sistemas cuadrafónicos y estarían reacios a aprobar un nuevo sistema de sonido envolvente. Los ingenieros y productores son un caso aparte. A las discográficas no les interesa si ellos usan un efecto en particular, o cierta unidad de reverberación en algún disco, mientras suene bien y se venda. De la misma forma, no les importaría si un ingeniero quiere hacer una mezcla ambisónica, el disco sonaría grandioso en estéreo, sin un decodificador ambisónico, y si alguien cuenta con uno
podría escuchar el efecto completo. Esto podría romper el problema del “huevo y la gallina” de Ambisonics. Si los ingenieros usaban el sistema porque sonaba mejor en estéreo, ya no digamos envolvente, entonces pronto habría muchos discos populares codificados ambisónicamente. El reto era entonces acercarse a los ingenieros y productores.

A través de sus contactos en la industria, Elen se acercó a varios ingenieros y productores, y el resultado lo podemos escuchar en álbumes como ‘Stereotomy’ de The Alan Parson’s Project y ‘Break Every Rule’ de Tina Turner.

Con todos los beneficios y ventajas que Ambisonics parece tener, uno se puede preguntar ¿por qué ésta tecnología no es ampliamente usada en la producción de audio hoy en día? La responsabilidad definitiva del fracaso de Ambisonics recae en la gestión de la NRDC y el BTG. A nivel técnico, los creadores de Ambisonics hicieron un excelente trabajo, pero todos ellos se equivocaton subsecuentemente en el vehículo de promoción que escogieron para su producto. Como inventores universitarios, tanto Gerzon como Fellgett carecían de habilidad de negocios como para desarrollar Ambisonics como un producto comercialmente viable.

Quizás su error más grande fue recurrir a un organismo como la NRDC, la cual, además de la extrangulación presupuestal que se ha expuesto anteriormente, era una organización especializada en otorgar licencias exclusivas. Desafortunadamente para Ambisonics, si aspiraba a convertirse en el sistema estándar, necesitaba haber licencias para quienes quisieran usarlo, tal como en el caso del Compact Cassette, la DAT, Dolby B o el Compact Disc. En ésto es donde la NRDC y el BTG fallaron. En lugar de eso, el BTG buscó a quien pudiera manejar toda la tecnología mediante una licencia exclusiva, y ésta fue otorgada eventualemte a la discográfica Nimbus, empresa que ha producido grabaciones ambisónicas de alta calidad desde 1972.

Arreglo para Formato B nativo

El arreglo de micrófonos original desarrollado por el Dr. Halliday para Nimbus, proporciona salidas en Formato B horizontal directamente de las cápsulas.
Imagen: Paul Hodges

Al día de hoy, casi toda la tecnología y el conocimiento detrás de Ambisonics ha pasado al dominio público, y su uso está más difundido que nunca, tanto en proyectos comerciales como en otros no dedicados a su comercialización. A nivel industrial,  el micrófono Soundfield manufacturado por  TSL Professional Products Ltd. (antes por  Calrec Audio Ltd.) continúa produciéndose y se apoya ahora en software para la codificación/decodificación de señales y compañias como Meridian Audio Ltd. producen procesadores de sonido envolvente con capacidad para decodificar UHJ. Pero Ambisonics no es sólo un fantástico micrófono con un campo de aplicación limitado; más que otras cosa, es una herramienta de producción que puede usarse para la distribución de música en soportes físicos, como lo han propuesto Richard Elen o Peter Carbines, utilizando alguna codificación de Dolby o DTS. La tecnología de Ambisonics se puede encontrar en equipos y procesadores en estudios de grabación, en plug-ins para estaciones de trabajo de audio digital, en sistemas de prueba y medición de audio, en simuladores y juegos de video. Ambisonics tiene también un potencial artístico, que puede aplicarse en el diseño de audio de una obra de teatro, en instalaciones sonoras o en la composición de música electroacústica.

Para leer más en la red:

www.ambisonic.net

www.ambisonic.info

Para escuchar:

JACKSON, F. & WHITLEY, J. S.: ‘The organ at York Minster — Works by Dupre, Vaugham Williams, Verne’, The Music Form York Record Label, HAR-791.

THE ALBION ENSEMBLE: ‘Works by Mozart, Debusy, Shostakovich, etc.’ SNH-510.

NEW DIXIELAND REFORMATION BAND: ‘Beginnings’ IMF Recordings, AMB-5201.

THE ALAN PARSON’S PROJECT: ‘Stereotomy’, Arista 259 050 (Gran Bretaña), ARCD-8384 (Estados Unidos), AL9-8384 (Estados Unidos LP), VPKI 7529 (Australia). 1985.

TINA TURNER: ‘Break every rule’, Capitol CDP 7 46323 2, 1986.

Referencias bibliográficas:

GERZON, M. A. ‘Surround Sound Psychoacoustics’ Wireless World vol. 80, diciembre de 1974.

ALEXANDER, R. C.: ‘Michael Gerzon. Beyond Psychoacoustics’ Dora Media Productions, Reino Unido, 2008.

GERZON, M. A.: ‘Periphony: With Height Sound Reproduction’ Journal of the Audio Engineering Society, Vol. 21, no. 1, Enero de 1973, pp 2-10.

FELLGETT, P. B:. ‘Ambisonics. Part One’ General System Description’ Studio Sound, Vol. 17, no. 8, Agosto de 1975, pp 20-22, 40.

GERZON, M. A.: ‘Ambisonics. Part Two’  Studio Techniques’ Studio Sound, Vol. 17, no. 8, Agosto de 1975, pp 24-26, 28, 30.

ELEN, R.: Whatever Happened to Ambisonics’, Audio Media, no. 16, noviembre de 1991, pp 50-56.

CARBINES, P., ELEN, R.: ‘Getting Ambisonics around’ Pyramedia Productions, Audio Engineering Society, 22a Conferencia, Reino Unido, 2007

Anuncios

Acerca de Victor Perales

Ingeniero de sonido victorperales@openmailbox.org

»

  1. Mi primer clavado a este blog. A esto le llamo hacer las cosas bien y bonito.

    Responder
  2. Pingback: ¿Qué sucedió con Ambisonics? « Victor Perales

  3. Pingback: Audiomáquinas | Los makers están cambiando las formas de hacer y escuchar música

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: