2013: El cerebro predictivo

Esta semana comentaré el artículo «Whatever next? Predictive brains, situated agents and the future of cognitive science«, publicado por Andy Clark en 2013.1

Este artículo forma parte de una línea teórica y de investigación a la que ya hemos dedicado algunas publicaciones, por lo que recomiendo como lecturas previas las dedicadas a Friston (2002; ver publicación),2 Vuust et al. (2006; ver publicación),3 Vuust et al. (2009; ver publicación),4 Vuust et al. (2011; ver publicación),5 y Hohwy (2012; ver publicación).6

En esta ocasión, dejaré algunos aspectos sin abordar que, si bien son importantes, se encuentran alejados de los intereses de este blog. Me centraré en introducir los conceptos más importantes que ayuden a comprender mejor las investigaciones realizadas con estímulos musicales que utilizan este marco teórico (p.ej., Vuust et al., 2006, 2009, 2011, 2014; y Van der Weij et al., 2017).3,4,5,7,8

Los cerebros, según la perspectiva actual, son esencialmente máquinas de predicción. Son paquetes de células que soportan la percepción y la acción al intentar constantemente combinar entradas sensoriales entrantes con expectativas o predicciones de arriba hacia abajo.

“Los errores en la predicción de las entradas de nivel inferior hacen que los modelos de nivel superior se adapten para reducir la discrepancia.”

En la actualidad, se asume que la información ambiental es percibida como resultado de dos clases de procesos: los guiados por los datos, conocidos como procesos de abajo-arriba (bottom-up processing), y los guiados conceptualmente, o procesos de arriba-abajo (top-down processing). Los procesos de abajo-arriba parten de las características físicas de los estímulos, mientras que los procesos de arriba-abajo serían los responsables de producir una interpretación de la información, partiendo de experiencias previas y conocimiento acumulado.

Ambos tipos de procesos se dan de manera conjunta, entendiéndose que la información fluye en ambas direcciones (Borenstein & Ullman, 2008).9

Según la teoría de la codificación predictiva, durante la percepción las instancias de alto nivel tratan de predecir el conjunto de señales recibidas. La entrada sensorial se combina con las expectativas, mejorando las futuras predicciones.

De Helmholz surge la idea clave de que los sistemas sensoriales están en el difícil negocio de inferir causas sensoriales de sus efectos corporales.”

“El cerebro no construye su modelo actual de causas distales (su modelo de cómo es el mundo) simplemente acumulando, desde abajo hacia arriba, una masa de señales de bajo nivel (…). Trata de predecir el conjunto actual de señales de sus mejores modelos de causas posibles.”

Para Helmholtz (1867),10 el cerebro se retroalimenta constantemente por medio de lo que denomina una «inferencia inconsciente», entrelazando las entradas sensoriales y las ideas mentales de un modo hipotético. Esta es una idea similar a la que asume la teoría de la codificación predictiva cuando sostiene que el cerebro realiza una constante retroalimentación entre estados top-down (patrones de inferencia establecidos) y estados botton-up (estímulos sensoriales entrantes).4

Un aspecto importante de la teoría de la codificación predictiva es que sostiene que por medio del preceso perceptivo el cerebro no es capaz conocer las causas de la estimulación (no llega a saber cómo es el mundo). Lo que hace es generar un modelo de causas probables, que pone a prueba de forma ininterrumpida.

La tarea del cerebro, vista desde cierta distancia, puede parecer imposible: debe descubrir información sobre las causas probables de las señales incidentes sin una forma de acceso directo a su fuente.

El cerebro se encuentra, siguiendo a Fred Rieke (1999),11 en el interior de una caja negra que toma inputs de un mundo externo complejo. Todo lo que «conoce», en un sentido directo, es la forma en que fluyen y se alteran sus propios estados, mientras que el mundo se encuentra fuera de sus límites (aunque puede, de manera importante, emitir comandos motores y esperar desarrollos).

Desde esta perspectiva, la tarea del cerebro no es mapear estados ambientales y relacionarlos con los estados internos, sino inferir la naturaleza de la fuente de la señal (el mundo) a partir de la señal de entrada, variable en sí misma. Esta suerte de “adivinación” se explica en esta teoría en modo bayesiano (para una explicación de la inferencia bayesiana, ver el artículo titulado «2002: La teoría de la codificación predictiva«, publicado en este mismo blog).

Todo lo que necesita pasar a través del sistema es la señal de error, que es lo que queda una vez que las prediciones y las señales entrantes se han igualado. En estos modelos, por lo tanto, la conectividad hacia atrás (recurrente) es la que lleva la carga de procesamiento principal.”

Asumiendo que el procesamiento durante la percepción es bidireccional (desde los niveles superiores hacia los inferiores y desde los superiores hacia los inferiores), las expectativas se pueden conceptualizar como una marea descendente de información prevista, que confluye con la marea ascendente que supone la información sensorial. Al confluir ambas mareas, se cancela todo lo que encaja con la predicción (para actualizar el modelo, no es necesario remitir esa información redundante hacia arriba). De esta manera, sólo lo inesperado logra pasar a un nivel superior, donde se ajustan las predicciones o se activa un nuevo conjunto de expectativas que hacen más justicia al input (volviendo a propagarse hacia abajo como una nueva ola de previsiones).

En este proceso, la noción del contexto es fundamental, pues proporciona todo lo necesario para que el proceso predictivo esté preparado para impactar el procesamiento de las nuevas entradas sensoriales.

Una ilustración clara del efecto que pueden llegar a tener las expectativas se puede encontrar en la investigación realizada por Egner y sus colaboradores (2010),12 quienes tras comparar la respuesta neuronal ante los estímulos «cara» y «casa», observaron que el área implicada en la percepción de la cara se activaba indistintamente ante ambos estímulos si existía una fuerte expectativa de que el estímulo fuera una cara. Sólo cuando existía una expectativa baja se diferenciaban las respuestas. Esto lleva a los autores a sopesar que el área estudiada podría tratarse mejor como una región que responde a la expectativa de una cara que como una región que responde al estímulo sin más. En una línea similar, Karsten Rauss y sus colaboradores (2011)13 afirman que «las señales neuronales se relacionan menos con el estímulo que con la congruencia con las metas y predicciones internas, calculadas sobre la base de la entrada previa al sistema«.

El peso otorgado al error de predicción sensorial varía de acuerdo a cómo de fiable sea la señal.”

“Todo esto hace que las líneas entre la percepción y la cognición sean borrosas, tal vez incluso desaparezcan. En lugar de una distinción real entre percepción y creencia, ahora obtenemos diferencias variables en la mezcla de influencia descendente y ascendente.”

“Creer y percibir, aunque conceptualmente distintos, surgen como profundamente entrelazados en la mecánica del proceso. Se construyen utilizando los mismos recursos computacionales.”

Los niveles superiores se considera que tienen un carácter más «cognitivo», los niveles inferiores son más «perceptuales», pero la percepción se produce en la interacción constante entre todos los niveles. Nuestro cerebro percibe utilizando lo que conoce para explicar las señales sensoriales. Partiendo de esta idea, los autores de la teoría de la codificación predictiva proponen algunas implicaciones interesantes. Por ejemplo, que un evento esperado que cumpla con todas nuestras expectativas implica que no necesita ser comunicado a áreas corticales superiores, en las que se han procesado ya todas sus características relevantes incluso antes de que ocurra (Bubic et al, 2010).14 Así, el contacto perceptual se limita a verificar la conjetura del cerebro, siendo las expectativas despertadas la fuente principal del contenido de nuestras percepciones.

La teoría de la codificación predictiva es especialmente útil para ofrecer una explicación de las ilusiones ópticas, y de entre todos los experimentos que describe Clark (2013)1 en su artículo, los que más interesan en este blog son los que estudian la «rivalidad binocular». Nos interesan aquí porque la denominada «percepción biestable», que surge en estos experimentos, es un fenómeno que también puede estudiarse con estímulos musicales.

La percepción biestable es el tipo de experiencia visual que ocurre cuando se presenta para cada ojo, de manera simultánea, un estímulo visual diferente. En el ojo derecho, por ejemplo, se presenta una imagen de una casa, mientras en el izquierdo se presenta una cara.

reval-oc

Fig. 1. Provocando la rivalidad binocular

En estas condiciones artificiales, la experiencia subjetiva es biestable. En lugar de experimentarse una fusión confusa de todos los puntos de la información, los sujetos reportan un tipo de alternancia perceptual entre la casa y la cara.

La explicación que ofrece la teoría de la codificación predictiva de este fenómeno parte de que las previsiones de orden superior actúan como prioridades para el procesamiento de nivel inferior. Una vez seleccionada la mejor hipótesis para explicar la causa de la estimulación visual, el resto son inhibidas. En el caso de la rivalidad binocular, la información de bajo nivel contiene información que sugiere dos estados distintos e incompatibles del mundo. Cuando se selecciona una de las opciones como la mejor hipótesis general (por ejemplo, que esa información corresponde al dibujo de una casa), ésta explicará sólo los elementos de entrada que predice esa hipótesis. Como resultado, el error de predicción para esa hipótesis disminuye, pero en lo que respecta a la hipótesis alternativa no se suprime; se propaga por la jerarquía. Para suprimir esos errores de predicción el sistema necesita encontrar otra hipótesis alternativa (que explique también la parte de información que corresponde al dibujo de una cara). Pero cuando encuentra la hipótesis alternativa (pasando la hipótesis dominante a ser la interpretación alternativa), vuelve a aparecer una gran señal de error de predicción, esta vez derivada de los elementos de la señal no explicados por la interpretación turnada.

Este es un escenario en el que ninguna hipótesis da cuenta de todos los datos, por lo que el sistema alterna entre los dos estados semiestables. Ambas hipótesis compiten, porque el sistema ha aprendido que sólo un objeto puede existir en el mismo lugar al mismo tiempo.

Este tipo de paradigma de investigación ha sido una herramienta poderosa para estudiar los correlatos neurales de la experiencia visual consciente, ya que las señales entrantes permanecen constantes, mientras que el percepto cambia de un estado a otro (Frith et. al. 1999).15

El fenómeno de la percepción biestable es posible encontrarlo en la música durante la escucha de lo que se conoce como «polirritmia». Un ejemplo típico es el llamado patrón “tres contra cuatro”, que se puede ilustrar tocando tres tiempos igualmente espaciados en una mano y cuatro tiempos igualmente espaciados en la otra al mismo tiempo, de modo que los periodos de ambos patrones estén sincronizados.

3VS4

Fig. 2. Ejemplo de polirritmo (midi)

Es posible percibir el metro de dicho patrón de dos maneras, como binario o como ternario. Si interpretamos que el metro es ternario, el patrón de cuatro tiempos actúa como un patrón contramétrico. Y si interpretamos que el patrón es binario, el patrón de tres tiempos será entonces el patrón contramétrico.

Si bien estamos hablando de una única manifestación acústica, la experiencia dependerá de cuál de los patrones se tome como señal que para definir el metro.

Sin embargo, la experiencia auditiva con este tipo de patrones rítmicos difiere de la rivalidad ocular de una manera importante: durante la escucha, es posible que los individuos entrenados musicalmente fuercen conscientemente la interpretación del patrón. Es decir, a pesar de que la información de entrada pueda apoyar una hipótesis y debiera ser tratada como la dominante, un oyente puede optar por la otra alternativa. De hecho, puede «escuchar» acentos en secuencias donde no hay (ver publicación). En cualquier caso, el perceptor debe dedicar un esfuerzo considerable para mantener su modelo métrico interno mientras la entrada rítmica se desvía de él.

Para una investigación de la percepción biestable por medio de la polirritmia, recomiendo la lectura del artículo dedicado a las realizadas por Vuust y sus colaboradores (2006, ver publicación; 2011, ver publicación).3,5 Asimismo, para una visión general y más actualizada recomiendo continuar con la lectura del artículo titulado «2014: La percepción del ritmo según la teoría de la codificación predictiva«, publicado en este mismo blog.


REFERENCIAS:

  1. Clark, A. (2013). Whatever next? Predictive brains, situated agents and the future of cognitive science. [DOI: 10.1017/s0140525x12000477]
  2. Friston, K. (2002). Functional integration and inference in the brain. [DOI: 10.1016/s0301-0082(02)00076-x] [Leer más]
  3. Vuust et al. (2006). It don’t mean a thing… keeping the rhythm during polyrhythmic tension, activates language areas (BA47). [DOI: 10.1016/j.neuroimage.2005.12.037] [Leer más]
  4. Vuust et al. (2009). Predictive coding in music. Brain responses to rhythmic incongruity. [10.1016/j.cortex.2008.05.014] [Leer más]
  5. Vuust et al. (2011). Tapping polyrhythms in music activates language areas. [DOI: 10.1016/j.neulet.2011.03.015] [Leer más]
  6. Hohwy, J. (2012). Attention and Conscious Perception in the Hypothesis Testing Brain. [DOI: 10.3389/fpsyg.2012.00096] [Leer más]
  7. Vuust et al. (2014). Neural Underpinnings of Music: The Polyrhythmic Brain. [DOI: 10.1007/978-1-4939-1782-2_18] [Leer más]
  8. Van der Weij et al. (2017). A Probabilistic Model of Meter Perception: Simulating Enculturation. [DOI: 10.3389/fpsyg.2017.00824]
  9. Borenstein & Ullman (2008). Combined TopDown/BottomUp Segmentation. [DOI: 10.1109/tpami.2007.70840]
  10. Helmholtz, H. (1867). Handbuch derphysiologischen optik, vol. 3. [DOI: 10.1016/S0016-0032(22)90789-6] [Enlace]
  11. Rieke, F. (1999). Spikes: Exploring the neural code. [DOI: doi.org/10.1086/420509]
  12. Egner, Monti & Summerfield (2010). Expectation and surprise determine neural population responses in the ventral visual stream. [DOI: 10.1523/jneurosci.2770-10.2010]
  13. Rauss et al. (2011). Top-down effects on early visual processing in humans: A predictive coding framework. [DOI: 10.1016/j.neubiorev.2010.12.011]
  14. Bubic et al. (2010). Prediction, cognition and the brain. [DOI: 10.3389/fnhum.2010.00025]
  15. Frith et. al. (1999). The neural correlates of conscious experience: An experimental framework. [ODI: 10.1016/s1364-6613(99)01281-4]