2009: La respuesta cerebral a la incongruencia rítmica

Esta semana comentaré el artículo «Predictive coding in music. Brain responses to rhythmic incongruity«, publicado en 2009 por Peter Vuust, Leif Ostergaard, Karen Johanne Pallesen, Christopher Bailey y Andreas Roepstorff.1

Este artículo debe considerarse una continuación de la entrada «2002: La Teoría de la Codificación Predictiva«, también publicada en este blog.

La teoría de la codificación predictiva es un modelo que pretende explicar el funcionamiento general de los procesos perceptivos. Según esta teoría, el cerebro no cesa de conjeturar acerca de lo que ocurre, suministrando predicciones a los diferentes receptores sensoriales. La característica principal de esta teoría es que pone el énfasis en los procesos de arriba a abajo como un componente importante de la percepción.

Algunos investigadores, entre los que destaca la figura de Peter Vuust, consideran que la teoría de la codificación predictiva puede servir como marco para la investigación del procesamiento del ritmo en el cerebro. La percepción del ritmo, desde esta teoría, se conceptualiza como una interacción entre lo que se escucha (el “ritmo”) y una estructuración anticipada por el cerebro (el “metro”). La relación entre ritmo y metro  es un ejemplo de procesamiento de abajo a arriba vs. procesamiento de arriba a abajo (entrada vs. modelo), analizable  desde la teoría de la codificación predictiva.

Recientemente, Friston (2002)2 presentó un modelo prometedor de función cerebral, en el que la codificación predictiva,  como principio, [ayuda a describir] la organización jerárquica del cerebro, donde las áreas cerebrales de menor nivel estiman las predicciones de su entrada, basándose en información contextual a través de conexiones hacia atrás desde áreas de mayor nivel.”

Como vimos en el artículo dedicado a la propuesta de Friston (2002, ver publicación),2 según la teoría de la codificación predictiva nuestro cerebro puede entenderse como un generador de hipótesis que no cesa de preguntarse sobre las causas de la información que recibe. Esto, además, ocurre en todos los niveles de la jerarquía: al tiempo que la percepción provoca un flujo de información que viaja desde instancias de bajo nivel hacia instancias de alto nivel, las instancias de alto nivel se sirven de la experiencia previa y el contexto para generar expectativas sobre el conjunto de esas señales.

La comparación entre la predicción y la entrada real produce un término de error que, si es lo bastante grande, actualizará el modelo. Esto genera un proceso recursivo que tiene como objetivo minimizar la diferencia entre la entrada y la predicción.

“El modelo predictivo de codificación implica que el cerebro intenta constantemente extraer regularidades estructurales del entorno.”

El proceso, tal y como señalan Vuust y sus colaboradores, tiene mucho de recursivo. Cuando la información de bajo nivel contradice las predicciones del modelo, se utiliza esa misma información para actualizarlo (mejorando en consecuencia las siguientes predicciones). Tras la actualización, se repite el proceso nuevamente, hasta que las previsiones son tan precisas que se elimina por completo la señal de error.

Un aspecto importante de esta teoría es que asume que el cerebro no llega a conocer jamás las causas de la estimulación. Lo que hace es generar un modelo de causas probables, que pone a prueba de forma ininterrumpida.

Para funcionar de un modo como el descrito (siendo la expectativa un elemento crucial), nuestro cerebro necesita extraer constantemente regularidades estructurales del entorno. Será capaz de establecer predicciones sobre la fuente de la estimulación en la medida en que detecte regularidades estructurales, o dicho de otro modo: cuando detecte patrones.

Hasta aquí, la teoría. El siguiente paso es preguntarse el modo en que podemos estudiar un proceso de estas características. Pues bien, si nuestro objetivo es analizar el modo en que extraemos regularidades de un contexto dinámico y respondemos a la frustración de nuestras expectativas, la escucha musical aparece pronto como un candidato inmejorable.

Es por esta razón por la que Vuust y sus colaboradores se interesan en la forma en que el cerebro responde a la incongruencia rítmica. En la escucha del ritmo musical, se hace envidente la existencia de patrones subyacentes (por ejemplo, la estructura métrica), producto de regularidades percibidas, que generan expectativas. Expectativas que la misma música se encarga de frustrar constantemente.

Si el objetivo es analizar el denominado «error predictivo», la música es un campo de experimentación ideal.

Hemos empleado magnetoencefalografía (MEG) para probar dos hipótesis:

  1. Que la respuesta neuronal a la incongruencia rítmica se comportan de acuerdo con un marco de codificación predictiva. 
  2. Que la competencia musical afecta la composición de las redes neuronales involucradas en el procesamiento del ritmo, al afectar la integración neuronal.”

“Hipotetizamos que las incongruencias rítmicas generarían la contraparte magnética del potencial de disparidad (MMNm), (…) acompañado por un componente posterior, el P3a.”

A partir del análisis de la actividad eléctrica cerebral (obtenida principalmente por medio de la colocación de electrodos en la superficie de la cabeza), los investigadores han identificado ciertas fluctuaciones que aparecen como respuesta a determinados tipos de estímulo. Esas variaciones, que se denominan «potenciales evocados», quedan registradas en un encefalograma, y se suponen indicadores de ciertos procesos cognitivos subyacentes. Uno de los tipos de señal que ha sido más estudiado (sobre todo cuando se trata de investigaciones con estímulos acústicos) es el denominado «potencial de disparidad», o MMN (en inglés, «mismatch negativity»).

El MMN se produce cuando detectamos un cambio acústico, al presentarse un estímulo auditivo que discrepa por alguno de sus atributos físicos del resto de la secuencia que le sirve de contexto (por ejemplo, cuando en una secuencia de tonos que tienen todos la misma frecuencia, intensidad o duración, uno de los eventos se desvía por variar alguno de esos atributos). Según las investigaciones realizadas sobre este potencial evocado, la respuesta del tipo MMN se puede detectar incluso en el feto y recién nacidos. Esto parece señalar, por una parte, que la respuesta se limita a un cambio en los atributos del sonido (la regularidad es, por así decirlo, sensorial), y por otra, que estamos ante una capacidad innata (somos capaces establecer representaciones de regularidades entre sonidos que se extraen del entorno acústico desde antes del nacimiento). Por otra parte, las investigaciones han demostrado que esta capacidad se mantiene, no sólo en situaciones de desatención, sino incluso en condiciones tan extremas como la sedación profunda (Koelsch et al., 2006).3

Por último, las investigaciones también han mostrado que el entrenamiento musical provoca una mejora en la detección de los cambios en los atributos que se corresponde con una señal más intensa (Putkinen et al., 2014).4

Volviendo al estudio de Vuust y sus colaboradores (2009),1 en lugar de utilizar electroencefalografía (EEG), analizan la respuesta cerebral que acabamos de describir por medio de magnetoencefalografía (MEG). Por esa razón afirman que su hipótesis es encontrar «la contraparte magnética» del potencial de disparidad (MMNm). En cuanto al componente P3a, se trata de un tipo de señal que fue observado anteriormente por Trainor y sus colaboradores en un estudio sobre la violación de expectivas melódicas (Trainor et al., 2002).5 Se considera que está asociado a una evaluación del cambio percibido, y es interesante porque parece corresponderse con la actualización del modelo predictivo.

Hipotetizamos que la violación del metro generará un término de error en el nivel neuronal, cuyo tamaño dependerá del grado de la violación. Si la violación es suficientemente grande, podrá causar una evaluación posterior que involucre estructuras neurales de mayor nivel..”

“Creamos secuencias rítmicas de creciente incongruencia rítmica y medimos las respuestas cerebrales con MEG para probar la hipótesis.”

La regularidad temporal en la música depende de que los sonidos se sucedan de una forma que se pueda predecir. El metro es un elemento crítico en este sentido, pues proporciona al oyente una estructura temporal subyacente que genera expectativas. Con la intención de analizar la relación entre la competencia musical y el comportamiento de los marcadores neuronales de incongruencia rítimica, Vuust y sus colaboradores compararon dos tipos de violaciones métricas: (i) síncopas en el bombo de un batería (un tipo de síncopa muy común) y (ii) una violación más general (en todos los instrumentos de la batería) que interrumpía el metro.

Las secuencias utilizadas en este estudio fueron:

  1. Un ritmo de rock simple de 4 tiempos,
  2. El mismo ritmo, pero incluyendo una síncopa consistente en la sustitución de un golpe débil por uno fuerte, desafiando la sensación del metro pero sin interferir con el pulso (una síncopa aceptable musicalmente),
  3. El mismo ritmo, pero con una alteración incongruente con la rejilla y el metro subyacentes (una interrupción o violación no métrica y musicalmente inaceptable).

Su hipótesis inicial fue que la violación del metro generaría una señal de error a nivel neuronal, cuyo tamaño dependería del grado de la violación y la experiencia musical de los oyentes.

Comparamos oyentes sin experiencia con músicos de jazz expertos. Los músicos de jazz están habituados a utilizar material rítmico desafiante, y por lo tanto son candidatos ideales para identificar supuestas diferencias que dependan de la competencia en el procesamiento de la violación métrica.”

Tras analizar los resultados obtenidos, Vuust y sus colaboradores concluyeron que la experiencia y entrenamiento de los músicos de jazz se vio reflejada tanto en los marcadores neuronales de error de predicción (MMN) como en los marcadores neuronales de evaluación (P3a). El aumento de incongruencia rítmica causó mayores respuestas neuronales. La magnitud de las respuestas MMN fue mayor para expertos que para los no músicos. La latencia fue más corta en el grupo de músicos.

Un resultado menos esperado fue que el grupo de músicos expertos respondió a la síncopa en la condición (2) de manera más fuerte que los no músicos, a pesar de que deberían estar más familiarizados con este tipo de vulneraciones. La hipótesis defendida por los autores es que su experiencia hace que la codificación sea más precisa (el modelo de arriba a abajo, que sería el metro esperado, es mejor) y que el procesamiento de los estímulos es más específico en la corteza auditiva. Es decir, los modelos métricos en los músicos son más fuertes que los en los no músicos, lo que lleva a un mayor error de predicción.

En cuanto al componente P3am, se localizó en todos los expertos, pero sólo en la mitad de los no músicos.

Los datos del estudio son, por tanto, congruentes con la teoría de la codificación predictiva. Según la interpretación de los autores, MMN y P3a reflejarían el error generado en la corteza auditiva y su posterior evaluación en una red más amplia que incluye generadores en la corteza auditiva y fuentes neuronales de nivel superior.

Para continuar con la lectura sobre investigaciones sobre la respuesta MMN provocada por la irregularidad temporal, recomiendo «2012: La inducción del pulso como rasgo musical básico« y «2014: Análisis del procesamiento del pulso como fenomeno pre-atentivo«.


REFERENCIAS:

  1. Vuust et al. (2009). Predictive coding in music. Brain responses to rhythmic incongruity. [10.1016/j.cortex.2008.05.014]
  2. Friston, K. (2002). Functional integration and inference in the brain. [DOI: 10.1016/s0301-0082(02)00076-x] [Leer más]
  3. Koelsch et al. (2006). Auditory processing during deep propofol sedation and recovery from unconsciousness. [DOI: 10.1016/j.clinph.2006.05.009]
  4. Putkinen et al. (2014). Investigating the effects of musical training on functional brain development with a novel melodic MMN paradigm. [DOI: 10.1016/j.nlm.2014.01.007]
  5. Trainor et al. (2002). Automatic and Controlled Processing of Melodic Contour and Interval Information Measured by Electrical Brain Activity. [DOI: 10.1162/089892902317361949]