Como parte del grupo de psiquatría computacional, la mayor parte de mi investigación en machine learning está enfocada a sus aplicaciones en el diagnóstico de enfermedades mentales. Esta es una tarea bastante complicada, incluso para psiquiatras con experiencia, ya que todavía desconocemos muchas cosas sobre el funcionamiento del cerebro y no existe algún test biológico que pueda ser usado para hacer diagnósticos precisos. Los algoritmos de inteligencia artificial también encuentran esta tarea complicada, ya que regularmente se cuenta con información de algunos cientos de pacientes, pero los datos contenidos en las imágenes cerebrales (o información genética) está en el rango de miles o cientos de miles. Este es un problema conocido como “small n, large p”, y hace referencia a la gran cantidad de datos que hay que analizar y los pocos pacientes disponibles para hacerlo. Cómo usar machine learning de manera efectiva en este escenario es parte de mis actividades de investigación.
Batch effects en fMRI*
*fMRI (resonancia magnética funcional por sus siglas en inglés) es una técnica de imagenología cerebral que consiste en obtener imágenes 3D del cerebro, cada 2 o 3 segundos, durante algunos minutos. Una forma de entender mejor esta técnica es imaginarse una película que muestra la actividad cerebral. Una de las maneras de analizar estos datos es creando un diagrama que muestra qué partes del cerebro están actuando al mismo tiempo. A este diagrama se le conoce como conectividad funcional.
Imagina por un momento que estás a cargo del hospital A y quieres usar machine learning para crear una herramienta que, dada una imagen generada por medio de fMRI de un paciente, pueda determinar si tal paciente tiene esquizofrenia o no. Inicias el experimento y recolectas datos de 100 personas con esquizofrenia y otras 100 personas sanas utilizando el escáner de resonancia magnética que está disponible en tu hospital. Analizas los datos, creas una herramienta de diagnóstico, y te das cuenta que tienes un 70% de efectividad. Sabes que puedes aumentar la efectividad si pudieras recolectar datos de más pacientes, pero eso costaría mucho dinero más. Poco después te enteras que tu amigo, quien trabaja en el hospital B, también está recolectando de personas con esquizofrenia, y también tiene datos de 100 pacientes y 100 personas sanas, ¡Ahora tienen el doble de datos y pueden mejor la eficacia del clasificador! Utilizando los datos de ambos hospitales creas un nuevo clasificador y lo pruebas en tu hospital… Ahora tu efectividad es del 65% ¿Por qué la efectividad disminuyó, no se supone que mientras más datos mejor?
Batch effects es un fenómeno en el cual las señales biológicas de interés presentes en los datos analizados contienen ruido causado por la forma de recolectar los datos. En el caso de fMRI este ruido puede ser introducido por el uso de distintas máquinas, diferentes condiciones de operación, etc. Esto ocasiona que la distribución de probabilidad de los datos del hospital A son diferentes de la distribución de lo datos del hospital B. Esto complica el trabajo de los algoritmos de machine learning, los cuales asumen que todos los datos son originados por la misma distribución de probabilidad. Nuestra investigación actual consiste en encontrar una representación de los datos que minimice las diferencias entre ambas distribuciones de probabilidad, permitiendo que podamos trabajar con los datos de ambos hospitales para crear mejores clasificadores. Este problema está muy relacionado con Domain adaptation y Transfer learning.
Publicaciones relacionadas con este tema (en inglés)
- The challenge of applying machine learning techniques to diagnose schizophrenia using multi-site fMRI data
- Finding Effective Ways to (Machine) Learn fMRI-based Classifiers from Multi-Site Data
Modelos gráficos dispersos (Sparse graphical models) en psiquiatría
En algunos casos, además de tener una alta efectividad en problemas que involucran clasificación (tal como el diagnóstico de enfermedades), estamos interesados en analizar cómo los datos están relacionados entre sí. O quizá tenemos información sobre estas relaciones y queremos que el modelo de clasificación que vamos a usar pueda sacar ventaja de esta información. Por ejemplo, quizá estemos interesados en encontrar cuáles son las diferencias más .importantes entre los diagramas de conectividad funcional entre personas con esquizofrenia y personas sanas. Los modelos gráficos probabilísticos son una herramienta que no únicamente nos permite hacer predicciones (por medio de inferencia estadística), sino que también nos interesa identificar relaciones estadísticas entre las variables de interés (en este ejemplo, cada región cerebral es una variable).
Cuando los datos a analizar son continuos (como en el caso de la conectividad funcional) este problema es relativamente fácil de resolver, y existen mucha literatura al respecto, siendo Graphical LASSO uno de los algoritmos más conocidos. Este no es el caso para el análisis de variables discretas o combinaciones de variables discretas y continuas. Durante los últimos años se ha visto progreso en esta área, pero sigue siendo un campo activo de investigación. Actualmente estoy explorando el uso de modelos mixtos (que mezclan variables continuas y discretas) para ayudar en el diagnóstico de enfermedades mentales. Los modelos gráficos mixtos pueden además ofrecer una alternativa para usar datos de diferente naturaleza, tales como imágenes cerebrales, información genética e información clínica. Adicionalmente, es común no tener acceso a todos los datos al momento de analizar a un paciente. Los modelos gráficos probabilísticos permiten hacer predicciones aún cuando no se cuenta con todos los datos, ya que siempre es posible marginalizar las variables de las cuales no se tiene información.
Publicaciones relacionadas con este tema
- Neurocognitive graphs of First-Episode Schizophrenia and Major Depression Based on Cognitive Features [Journal] [Preprint]
Reportes no publicados relacionados con este tema
Análisis de datos EEG*
*EEG (Electroencefalografía) es otra modalidad usada para extraer datos de la actividad cerebral. Este técnica consiste en colocar electrodos en la cabeza de un paciente para obtener señales que están relacionadas con la actividad eléctrica cerebral.
A lo largo de los años he participado en algunos proyectos que usan datos extraídos por medio de EEG, principalmente en actividades de investigación relacionadas con el desarrollo de interfaces cerebro – máquina basadas en imaginación motora. Imaginación motora es una actividad en la cual una persona imagina que está haciendo un movimiento (por ejemplo, mover la mano derecha), pero no ejecuta el movimiento, únicamente lo imagina. El objetivo de esto es, usando únicamente información de la actividad cerebral, tratar de identificar qué movimiento estaba imaginando. Este tipo de interfaces es potencialmente útil para personas con una discapacidad motriz severa. La mayor parte de los proyectos en los que he participado en esta área han sido colaboraciones con el grupo del profesor Mauricio Antelís, quién es parte del Tecnológico de Monterrey en México. Para el análisis de estos datos he usado redes neuronales recurrentes y convolucionales, así como Hidden Markov Models.
Publicaciones relacionadas con este tema
- Assessment of feature selection and classification methods for recognizing motor imagery tasks from electroencephalographic signals
-
Classification of Hand Movements from Non-invasive Brain Signals Using Lattice Neural Networks with Dendritic Processing [Journal] [Preprint]
Reportes no publicados