sábado, 18 de octubre de 2008

Neurociencia computacional y conductas adictivas



En los últimos años han surgido una serie de modelos computacionales que intentan explicar los mecanismos cerebrales y de conducta que están en el origen de los comportamientos adictivos. Quizá el pionero de este tipo de modelos ha sido David Redish, profesor del Departamento de Neurociencia de la Universidad de Minnesota. Su artículo en Science (2004), titulado "Addiction as a computational process gone awry", significó el punto de partida para la proliferación de modelos en los últimos 4 años, algunos de ellos muy significativos y que, sin duda, van a tener aplicaciones terapéuticas. Redish es un caso curioso de diversificación del talento. Más conocido por su interés en el tema de los mapas cognitivos y células de localización espacial (véase en este mismo blog la entrada sobre O´Keefe y Nadel), lleva unos cuantos años dedicado a aplicar sus descubrimientos sobre los mecanismos cerebrales implicados en la navegación animal al tema de por qué los antagonistas de los opiáceos reducen las respuestas hedónicas. Según Redish y Johnson (2007), hay dos sistemas en el cerebro de los mamíferos: un sistema flexible capaz de tomar decisiones con rapidez pero computacionalmente muy exigente y un sistema inflexible, que puede actuar rápidamente pero muy lento en su desprogramación. El sistema inflexible es un sistema de hábitos que sólo requiere unos limitados recursos computacionales para ponerse en marcha. El sistema flexible requiere reconocer una situación y unos procedimientos para alcanzar un objetivo a partir de la situación. A su vez, evaluará el valor de la consecución del objetivo, que dependerá de las necesidades actuales del agente.
El sistema inflexible implica una simple asociación entre la situación y la acción. La evaluación en este segundo sistema implica una memoria del valor aprendido que asocia la acción con la situación presentada. En el fondo se trata de un mecanismo de aprendizaje por refuerzo, basado en la diferencia temporal.
Los autores mencionados han observado en el conjunto neuronal del hipocampo de ratas, que las elecciones consistentes en avanzar en un laberinto son elecciones de alto coste computacional. Las ratas fueron entrenadas para una tarea de elección en la que tenían que elegir el recibir comida. Las ratas, en la parte inicial de la sesión, tomaban una pausa en aquellas elecciones costosas y mostraban una conducta similar a una conducta vicaria de ensayo y de error.
Para evaluar el valor de esa conducta, el sistema precisa de una señal que reconozca el valor hedónico. Las señales hedónicas son transmitidas por el sistema de señalización de los opiáceos, tal y como es puesto de manifiesto por el efecto de los agonistas y antagonistas de opiáceos. Hay múltiples tipos de receptores de opiáceos en el cerebro de los mamíferos, unos son euforizantes mientras que otros son aversivos. Estos tipos de receptores tienen consecuencias inmediatas para procesos tales como el ansia o deseo intenso. Se trata de una sensación interna que no siempre es reflejada en acciones externas. En términos operacionales, puede definirse como el reconocimiento de que existe un camino a una salida de valor elevado. Esta expectativa sólo puede darse en el sistema de planificación flexible y no en el sistema de hábitos, puesto que el sistema de hábitos no incluye el reconocimiento de la salida esperada. Debido a que el sistema flexible sólo entraña el reconocimiento de que una acción puede conducir a un camino potencial hacia una meta y no entraña un compromiso respecto a la acción, el estado de ansia no va a generar necesariamente una selección para producir acciones. En el sistema de planificación, cuando el hipocampo alcanza una meta que es evaluada como de valor elevado, surgirá un fuerte deseo de conseguir esa meta. Esta sensación de ansia debe también implicar estructuras cerebrales relacionadas con la evaluación de futuras recompensas, tales como el córtex órbitofrontal y el núcleo accumbens.
Los antagonistas competitivos de opiáceos se han usado clínicamente para reducir el ansia. Cuando el componente predictivo del sistema de planificación identifica los medios potenciales de obtener un resultado, el componente evaluativo generará señales de recompensa (opiáceos endógenos), establecindo el valor de aquella salida para propósitos evaluativos: la identificación de un camino que conduce a una recompensa elevada lleva a ansiar aquella recompensa. Bloquear aquellas señales de recompensa reduciría el valor hedónico subjetivo de recibir la misma y también amortiguaría el ansia. Si la señal de recompensa se basa en el sistema de señalización de opiáceos, esto puede explicar el porqué antagonistas de opiáceos tales como la naltrexona pueden reducir la sensación de ansia.