2002: La Teoría de la Codificación Predictiva

Esta semana comentaré el artículo «Functional integration and inference in the brain«, publicado por Karl Friston en 2002.1

Este documento no aborda ningún aspecto específicamente musical, por lo que no parece que tenga mucho sentido dedicarle una publicación específica en este blog. No obstante, gran parte de los artículos que comentaré durante las próximas semanas estarán vinculados con la «Teoría de la Codificación Predictiva», y dada su complejidad, considero que no vendrá mal un artículo general, que sirva de contexto.

Una vez analizada la bibliografía relacionada con este enfoque, he elegido «Functional integration and inference in the brain«, de Karl Friston, por varias razones. Cuando uno rastrea los primeros textos vinculados con esta teoría, resulta verdaderamente complicado ubicar sus inicios y ofrecer una primera lectura útil. Como primer artículo, podría comentar la investigación de Rao & Ballard (1999),2 donde ya se menciona la codificación predictiva refiriéndose a ciertos efectos extra-clásicos relacionados con la vista, pero es una publicación demasiado específica. El texto de Friston (2002),1 en cambio, aunque se encuentra alejado del abordaje que me gustaría realizar en este blog, es mucho más general, y por su carácter teórico resulta mucho más conveniente.

Puesto que este artículo no aborda temas musicales, tan sólo dejaré constancia de algunos aspectos que podrían ayudar a comprender o fundamentar otros textos posteriores que sí se centran en la percepción de estímulos musicales.

Según el modelo más influyente en la actualidad, percibimos la información ambiental como resultado de dos clases de procesos: los guiados por los datos, conocidos como procesos de abajo-arriba (bottom-up processing), y los guiados conceptualmente, o procesos de arriba-abajo (top-down processing). Los procesos de abajo-arriba parten de las características físicas de los estímulos, mientras que los procesos de arriba-abajo serían los responsables de producir una interpretación de la información, partiendo de experiencias previas y conocimiento acumulado. Ambos tipos de procesos se dan de manera conjunta, entendiéndose que la información fluye en ambas direcciones (Borenstein & Ullman, 2008).3

Uno de los aspectos más importantes de los procesos de arriba-abajo (guiados conceptualmente) es que explican el modo en que la expectativa afecta a la percepción. En el ejemplo siguiente podemos observar que, en el contexto de la izquierda, la expectativa de encontrar una letra provoca una interpretación distinta de la que se da en el contexto de la derecha, donde esperamos encontrar un número.

letters

 Un ejemplo de cómo el contexto afecta a la percepción

Los atributos físicos no pueden explicar por qué en un caso vemos una letra B, mientras que en el otro vemos el número 13, pues en ambos casos la configuración es la misma. La explicación se encuentra, no en los atributos del estímulo aislado, sino en la expectativa inducida por el contexto: cada contexto (letras o números, en el ejemplo) establece un tipo de expectativa, y esa expectativa influye en la percepción.

En situaciones como ésta se hace evidente que la percepción no puede explicarse como un proceso de una única dirección, desde el simple análisis de datos sensoriales hacia construcciones más complejas (más cognitivas). La información fluye en ambas direcciones.

La percepción, desde esta perspectiva, se encuentra estrechamente vinculada a los procesos de categorización. En el ejemplo anterior, el contexto induce una categoría, y esto conduce a una interpretación: cuando la causa de la percepción se categoriza como número, el resultado del proceso nos da un 13; cuando se categoriza como letra, una B.

Las causas son simplemente los estados del proceso que generan datos sensoriales. No es fácil atribuir significado a estos estados sin apelar a la forma en que categorizamos las cosas, perceptualmente o conceptualmente.”

Según la teoría de la codificación predictiva, nuestro cerebro genera constantemente hipótesis sobre las causas. Esto ocurre a cada nivel de la jerarquía: al tiempo que la percepción produce una entrada de información desde instancias de bajo nivel hacia instancias de alto nivel, las instancias de alto nivel tratan de predecir el conjunto de esas señales. Para hacerlo, se basa en la experiencia previa, atribuyendo el origen de la información a las causas más probables.

Volviendo al ejemplo anterior, no es posible explicar el proceso por el que percibimos un número (o una letra) partiendo únicamente de los atributos de la realidad física (información de bajo nivel). Nuestro cerebro no puede construir el número 13 (o la letra B) partiendo sólo de esos atributos físicos. Debido a la ambigüedad de la forma (que puede ser interpretada tanto como un número 13 como una letra B), para explicar el proceso es necesario incluir un flujo de información descendente, que define la causa más probable (si está entre números, la causa más probable será un número, y por tanto la forma percibida es la del número 13, en lugar de la letra B).

Aquí se encuentra uno de los puntos más interesantes de esta propuesta. Para la teoría de la codificación predictiva, el cerebro no llega a conocer las causas de la estimulación. Lo que hace es generar un modelo de causas probables, que pone a prueba de forma ininterrumpida.

Este es un punto importante, que distingue a los modelos de codificación predictiva de sus predecesores. A continuación, Friston analiza algunas de las propuestas previas.

El conexionismo es un enfoque que ha demostrado ser muy útil para relacionar las supuestas arquitecturas cognitivas con las neuronales y, en particular, modelar el impacto de las lesiones cerebrales en el rendimiento cognitivo. El conexionismo se utiliza aquí como un ejemplo bien conocido de aprendizaje supervisado en neurociencia cognitiva.”

Uno de los objetivos de la teoría de la codificación predictiva es ofrecer un modelo de funcionamiento para el cerebro que resulte plausible y explique su funcionamiento mejor que las propuestas anteriores. Sobre los modelos conexionistas basados en redes neuronales con aprendizaje supervisado, Friston reconoce que logran emular de manera convincente las consecuencias neuropsicológicas de las lesiones cerebrales, pero tienen limitaciones cuando tratan de ofrecer una descripción del aprendizaje representacional. Por un lado, parten de un conocimiento de las causas y de los procesos generativos. Por otra, omiten las interacciones entre las causas (impidiendo un análisis de los efectos del contexto).

En cuanto a los modelos que se enmarcan en la teoría de la información, basados en el principio infomax, Friston reconoce que tienen la ventaja de que en ellos el algoritmo no está supervisado (no necesita las causas y el proceso generador). Sin embargo, todavía presentan limitaciones. Por una parte, la recuperación de las causas depende de que el proceso generativo sea revertible. Por otra, asumen que las causas son independientes (algo que puede darse en sistemas simples, pero no en procesos como los que generan las entradas sensoriales).

En contraste con los anteriores, los modelos de la codificación predictiva no requieren una invertibilidad de los procesos o una independencia de las causas, sugiriendo una forma más natural del aprendizaje representacional.

Los modelos predictivos (…), en lugar de tratar de encontrar funciones de los inputs que predicen las causas, encuentran funciones de estimaciones causales que predicen los inputs.”

Es decir, que en lugar de deducir una causa por medio de la entrada sensorial, establecen funciones de probabilidad sobre las posibles causas que predicen la entrada sensorial. Y esto ocurre en cada nivel de la jerarquía del modelo. Esta es una característica fundamental de estos modelos. Asumen que la percepción produce una entrada de información desde instancias de bajo nivel hacia instancias de alto nivel, pero en lugar de construir una representación del mundo partiendo de esa información, las instancias de alto nivel tratan de predecir el conjunto de señales recibidas por medio de un modelo de causas posibles.

Desde esta perspectiva, existen arquitecturas funcionales, no para filtrar la entrada para obtener las causas, sino para estimar las causas y probar las predicciones con la entrada observada. Un aspecto convincente de los esquemas de codificación predictiva es que se prestan al tratamiento bayesiano. Esto es importante porque puede extenderse usando bayes empíricos y modelos jerárquicos.”

Este es otro de los aspectos importantes de la teoría de la codificación predictiva: se fundamenta en el teorema bayesiano, en el sentido de que considera que la generación de hipótesis sobre las causas de la entrada sensorial se puede interpretar bayesianamente. Conviene que nos detengamos un momento en este punto.

El objetivo de Thomas Bayes fue encontrar un método por medio del cual se pudiese juzgar la probabilidad de que un evento ocurra, en determinadas circunstancias, bajo el supuesto de que no sabemos nada de éste más que, en las mismas circunstancias, ha ocurrido un cierto número de veces y ha fracasado otro número de veces.

cardsA continuación intentaré explicar de forma sencilla la utilidad de la propuesta de Bayes por medio de un ejemplo:

Imaginemos que tenemos dos barajas sobre la mesa. Sabemos que cada una de las barajas tiene ocho cartas. También sabemos que hay tres ases en la primera baraja, y cuatro en la segunda. Sacamos una carta de la primera baraja y, sin mirarla, la incluimos en la segunda.

El teorema de la probabilidad total nos daría la probabilidad de extraer un as de la segunda baraja. La propuesta de Bayes es diferente, pues permite deducir la probabilidad de haber extraído un as de la primera baraja, tras conocer el resultado de la segunda extracción.

La fórmula de Bayes, por tanto, vincula la probabilidad de que se haya producido una causa (en el ejemplo anterior, la probabilidad de que hayamos introducido un as en la segunda baraja) dados los efectos observados.

Llevado a la teoría de la codificación predictiva, este enfoque implica que la dinámica neuronal no representa las causas de la entrada sensorial (no representa un estado del mundo), sino las densidades de probabilidad de las causas posibles.

El enfoque de codificación predictiva se presta naturalmente a un tratamiento jerárquico, que considera el cerebro como un dispositivo bayesiano empírico. La dinámica de las unidades o poblaciones se dirige a minimizar el error en todos los niveles de la jerarquía cortical y se hacen implícitamente estimaciones de las causas dados los datos.”

El tercer aspecto de la teoría de la codificación predictiva que me gustaría señalar aquí es la importancia del error predictivo. En los modelos de la teoría de la codificación predictiva, durante la percepción las instancias de alto nivel tratan de predecir el conjunto de señales recibidas. Si la información de bajo nivel contradice las predicciones del modelo, se utilizará esa misma información para actualizarlo (mejorando en consecuencia las futuras predicciones). Si, por el contrario, la señal confirma las previsiones del modelo, se producirá una suerte de bloqueo en la dirección abajo-arriba de todo lo que confirme las expectativas, de manera que sólo la información que no se corresponde con lo previsto será procesada en instancias de alto nivel (se prioriza por tanto la señal de error, por ser la información relevante para la actualización del modelo).

Con esto, doy por finalizado este post introductorio a la teoría de la codificación predictiva. Mi intención aquí sólo ha sido ofrecer un primer acercamiento. En posteriores publicaciones se explicarán algunos puntos con mayor detenimiento, y lo que es más importante, se relacionarán con fenómenos musicales.

Como siguiente lectura, recomiendo el artículo «2009: La respuesta cerebral a la incongruencia rítmica«, publicado en este mismo blog, donde se comenta una investigación relacionada con la teoría que acabamos de  introducir. Asimismo, recomiendo la lectura de «2013: El cerebro predictivo«, para profundizar más en el enfoque teórico.


REFERENCIAS:

  1. Friston, K. (2002). Functional integration and inference in the brain. [DOI: 10.1016/s0301-0082(02)00076-x]
  2. Rao & Ballard (1999). Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects. [DOI: 10.1038/4580]
  3. Borenstein & Ullman (2008). Combined TopDown/BottomUp Segmentation. [DOI: 10.1109/tpami.2007.70840]