Medicina, Big Data e Inteligencia Artificial

La telemedicina viene velozmente ganando terreno en su incorporación a las prácticas de medicina. Son prueba de ellos las diferentes instancias de adopción de estas herramientas que estamos presenciando a escala global. Así, lo que hace unas décadas eran especulaciones futurológicas, es hoy -o está en vías de ser- un conjunto de opciones operativamente reales, con sus posibilidades utilización al alcance de todos. En estos párrafos daremos un panorama general sobre diferentes tecnologías relacionadas con inteligencia artificial, que complementan y potencian enormemente la aplicación de telemedicina. Nos detendremos especialmente en el análisis del texto en el dominio del lenguaje médico.

Data Science, o “ciencia de los datos”, pone al alcance de las aplicaciones de gestión, de forma empaquetada, métodos basados en modelos cuantitativos y algoritmos complejos, hasta hace pocos años reservados al ámbito de investigación y estado del arte académico. Ello habilita por un lado a realizar tareas donde la precisión estaba limitada a la capacidad de evaluación manual, y por otro a elaborar conclusiones basadas en un volumen de datos (big data) imposible de procesar por una persona o por los sistemas informáticos tradicionales.

Una de las aplicaciones más conocidas de aprendizaje máquina es la clasificación de imágenes. Mediante el entrenamiento de un modelo, donde se etiquetan ejemplos como positivos o negativos respecto a la presencia de una determinada característica, se obtiene un clasificador que es capaz de discernir la presencia o no de lo que estamos buscando; es lo que conocemos como un “patrón”. Puede ser que queramos encontrar el patrón que representa algo conocido, o verificar que no se cumple un patrón; en este último caso hablamos de “anomalía”. Un ejemplo de esto son las numerosas aplicaciones disponibles para móviles, para detección de cáncer de piel a partir de una imagen.

 

Otro caso conocido de Big Data en medicina lo constituye el análisis genómico, o más en general, de cualquier producto resultante de la secuenciación, sea ADN o ARN. En cualquier caso estaremos tratando con archivos de decenas o cientos de gigabytes por cada análisis. Las tecnologías para secuenciación de próxima generación (Next Generation Sequencing – NGS) han disminuido drásticamente los costos del proceso básico de análisis genómico, proveyendo plataformas para el análisis bioinformático que en poco tiempo estarán al alcance de todos los pacientes.

El tratamiento de textos, o más específicamente la extracción de conocimiento a partir de la literatura disponible, cuenta con un gran desarrollo y existen múltiples líneas de trabajo específicas. Trabajar con un texto escrito en lenguaje natural implica conocer tanto las fuentes como el área de aplicación. Podemos estar hablando de registros médicos donde se da cuenta de la sintomatología del paciente, tratamientos pasados y hasta diagnósticos, o artículos provenientes de publicaciones académicas que, además, pueden estar disponibles en diversos idiomas. Un primer problema lo constituye la terminología: cómo nombrar correctamente a un procedimiento, una enfermedad, un síntoma, y viceversa, cómo saber cuándo el texto se está refiriendo a un concepto determinado. En este sentido, Uruguay ha dado un paso muy importante al integrarse a Snomed CT, una colección de ontologías de términos médicos que contienen más de 400.000 conceptos, disponible no sólo en varios idiomas sino también en denominaciones locales. La primera versión de Snomed CT fue liberada por Salud.UY en 2016.

Por otro lado, tenemos un continuo flujo de publicaciones que dan a conocer hallazgos en diferentes subdisciplinas de la medicina. Probablemente uno de los mejores ejemplos sea PubMed del National Institute of Health de Estados Unidos, donde cientos de artículos son publicados a diario reportando hipótesis, conclusiones y métodos que van tallando el estado del arte en muy diferentes aspectos de la medicina. En Latinoamérica tenemos también Scielo, una biblioteca científica en línea con numerosos artículos y proceedings de conferencias.

Acceder a toda esta información textual no es viable en un tiempo humano. Allí es donde el procesamiento de lenguaje natural (PLN), apoyado en las últimas herramientas de inteligencia artificial (AI), se convierte en una herramienta fundamental. Planteado un problema a investigar, PLN + AI realizan la extracción de información relevante al problema, identificando las mejores fuentes a considerar e inclusive sugiriendo conclusiones. Cabe aclarar que queda bajo responsabilidad del equipo médico finalmente, tomar la decisión sobre un diagnóstico. Como hemos dicho, se trata de poner sobre el escritorio del médico la información verdaderamente relevante, tomando en cuenta todas las fuentes y novedades disponibles hasta el momento.

El acceso a la información se puede hacer también a través de lenguaje natural, literalmente dialogando con la herramienta, a través de una interfaz conversacional (chatbot), o “asistente virtual” en su versión más elaborada. Nuestra conversación puede ser escrita o hablada, utilizando tecnologías de voz a texto.

Finalmente, en tiempos en que historia clínica se vuelve electrónica, es natural pensar en la integración punta a punta de todo este proceso de análisis y diagnóstico, asistiendo mediante nuevas herramientas al profesional médico, irremplazable, y responsable último de la toma de decisión, en términos de diagnóstico tanto como de tratamiento.

Fernando López Bello   @fer_lopezbello

Ingeniero en computación, PMP / Especialista en Big Data

Leave a Reply