Combate al Coronavirus COVID-19: el aporte de Quanam

Introducción

Desde que el viernes 13 de marzo de 2020 se diagnosticaron los primeros casos en Uruguay, el combate al coronavirus COVID-19 se ha vuelto el principal tema en el país. Fue así que el gobierno tomó medidas para intentar enlentecer la propagación ya que tiene una capacidad de transmisión mucho más alta que otras enfermedades. Su factor R0 es de 2.68, es decir que cada enfermo es capaz de contagiar a esa cantidad de personas. Este número es bien importante porque se asume que con un R0 por debajo de 1 la epidemia está controlada.
El factor R0 se calcula y puede ir variando, ahí es justamente donde queremos incidir, tratando de que baje haciendo que la propagación sea lo más lenta posible.

Para evitar una crisis en los hospitales, las autoridades de salud dicen que es esencial reducir la propagación, lo que se conoce como «aplanamiento de la curva». Eso se hace mejor detectando a las personas infectadas y enviándolas a ellas y a sus contactos cercanos a la cuarentena. La población puede ayudar mediante el distanciamiento social, evitando reuniones y quedándose en casa.

Por esto, es que creemos  importante estudiar y conocer las interacciones entre las personas ya que las redes sociales (¡de la vida real, no Facebook, Twitter, Instagram!) afectan la transmisión de enfermedades, haciendo explícitas las interacciones entre lugares con ondas de transmisión de ida y vuelta como escuelas, oficinas, eventos y el hogar.

Las redes sociales se componen de las interacciones que tenemos con nuestra familia, amigos, compañeros de trabajo y vecinos, pero también interactuamos con extraños en eventos, pubs y en comercios. Estos son los tipos de conexiones que se intentan modelar mediante el análisis de redes sociales ya que son los caminos por los que se propaga el virus.

Comprender la estructura de estas redes y el comportamiento del virus a medida que se mueve a través de ellas, nos da una idea de cómo interrumpir la propagación y defendernos. También nos da la oportunidad de predecir cómo se propagará el virus.

Background

En su momento habíamos utilizado un modelo similar en el contexto del Sistema Nacional de Información Ganadera (Ministerio de Ganadería, Agricultura y Pesca) para ver predios relacionados epidemiológicamente, pero ahora había que darle una vuelta de tuerca para nuestro aporte al combate al coronavirus COVID-19.

El sábado 14 nos pusimos a trabajar en el modelo que se basa en algunos supuestos (estos pueden ser el número de contactos por persona, la distancia al trabajo, el tamaño del lugar de trabajo, el tamaño del hogar, sus movimientos, participación en eventos, etc.).
Se cargó con datos ficticios a la hora de hacer una prueba de concepto y determinar si el modelo aporta valor y es útil para el país en el combate al coronavirus COVID-19.
No toda la información es fácilmente conseguible y hay que tener cuidado con posibles violaciones de privacidad (datos personales), pero no es necesario que esté toda la información para poder empezar a trabajar. La información necesaria se podría extraer de:

  • BPS, viendo dónde trabaja cada quien.
  • Administración de los Servicios de Salud del Estado (ASSE) o MSP para saber en qué hospital se atiende (disponibilidad de camas, cobertura de personas con mayor riesgo, etc.).
  • Sistema de Información Integrada del Área Social (SIIAS) para saber los grupos familiares.
  • Dirección Nacional de Migraciones, para saber personas que hayan entrado al país, hoteles dónde se quedan, etc.
  • Sistema de Transporte Metropolitano + compañías de transporte + información de movilidad de ANTEL (en función de las antenas a las que se conectan los celulares) ya que pueden dar datos de movilidad.
  • Tickantel y otras plataformas para saber en qué eventos interactuaron personas.
  • Información de tarjetas de crédito/débito que podrían dar información acerca de qué comercios visitó una persona, etc.
  • Administración Nacional de Educación Pública (ANEP) para saber qué chicos van a qué escuela.
  • Matrículas de Universidades, clubes deportivos/sociales, etc.

Históricamente la evaluación del impacto de diferentes redes sociales en la propagación de enfermedades respiratorias se ha visto limitada por la falta de datos detallados sobre la transmisión fuera del hogar, así como por métodos estadísticos apropiados. Hoy en día tenemos información por todos lados y mucho poder de cómputo como para poder afrontar el problema.

Por otro lado, hay que aclarar que es importante de dónde salen los datos y que la fuente de información sea válida, información errónea puede traer consecuencias muy importantes ya que afecta directamente la toma de decisiones. Prefiero no tener reloj y guiarme por el Sol que tener un reloj que me diga mal la hora.

Medidas de Centralidad

Parte fundamental del análisis son las medidas de centralidad, las clásicas  que son 4 distintas: grado, cercanía, intermediación y vector propio.

  1. Grado: corresponde al número de interacciones que posee un nodo con los demás. Se podría visualizar como la “cantidad de amigos”.
  2. Cercanía: se basa en calcular el promedio de las distancias más cortas desde un nodo hacia todos los demás. Se visualiza como la persona que está más cerquita (menos saltos) de todo el resto.
  3. Intermediación: es el número de veces que un nodo actúa como un puente a lo largo del camino más corto entre otros dos nodos. Se visualiza como un aeropuerto en el que es muy probable que haya que hacer escala para llegar de un lado a otro.
  4. Vector propio: mide la influencia de un nodo en una red. Intuitivamente viene a ser algo así como una persona que está bien conectada a otras personas que también están bien conectadas.
    En este caso es importante porque las personas en el centro de la red suelen ser más propensas contagiarse. Serán los primeros en contraer el virus. Las personas en los bordes de la red, aquellas con pocos amigos y contactos, son las menos propensas a enfermarse. Es posible que nunca contraigan el virus, pero si lo hacen, sucederá tarde en el curso de la epidemia.
    Identificando a las personas en el centro de la red (aquellas con mucha interacción con amigos y contactos) tienen más probabilidad de contagiarse y habrá mayores chances de enfermar a un número grande de personas. Esto podría proporcionar un sistema de alerta temprana para epidemias y ser útil en la planificación proactiva de brotes.

El Modelo

Paso a detallar las entidades que se modelaron utilizando la herramienta IBM i2 que son nuestro aporte al combate al coronavirus COVID-19.

A su vez cada una de esas entidades tiene atributos, por ejemplo, de una Casa se sabe la calle, el número de puerta, número de apartamento, tamaño y latitud y longitud para poder ubicar geoespacialmente con facilidad. Esta entidad se vincula (mediante un link o enlace) al Barrio, que a su vez se vincula a una Ciudad, que está vinculada a un País.

Encuentro, por su parte, sirve para modelar una reunión o similar entre 2 o más personas, también permite vincularse, por ejemplo con Pub.

La entidad Enfermedad se modeló para poder vincularla a las Persona y poder saber el riesgo que implicaría que ella contraiga el virus a partir de sus enfermedades preexistentes, como pueden ser: diabetes, problemas cardíacos, problemas respiratorios, entre otras.

Un Evento en tanto puede llegar a ser muchas cosas, desde un partido de fútbol, concierto, casamiento, cumpleaños. Esa entidad tiene una fecha, hora, lugar y también coordenadas para poder geolocalizar.

Cuando se crea un Movimiento (que tiene fecha, hora, tipo de vehículo, matrícula) también se crean varios enlaces, uno a la Ciudad de origen, otro a la Ciudad de destino y tantos como sean necesarios para involucrar a todas las Personas que hayan participado de ese Movimiento.

Organización se utiliza para contener ya sea empresas, clubes, etc.

Tratamiento contiene la fecha en que se realizó y se vincula al Doctor, al Hospital y a la Persona que fue tratada.

En la imagen a continuación se visualiza una entidad Persona instanciada con mis datos:

Posible análisis

Vale aclarar que la base de datos se cargó con información ficticia, para poder contar una historia. Toma datos de la realidad para que haga sentido a quién la escucha.

Una vez que una entidad se posiciona en el gráfico, se puede expandir para ver todas sus relaciones. En mi caso:

Se ven mis padres y hermanos, que trabajo en Quanam, que tuve un encuentro con alguien en la calle el 10/03/2020 (aún no sabemos con quién), que vivo con mi esposa en la misma casa y que fuimos a ver juntos dos shows, además de mi teléfono celular.
A su vez se pueden expandir esas entidades para ver a qué se conectan y así ir armando la red social:

En la imagen podemos ver a mis compañeros de Quanam, en el caso de Ana vemos que también fue al concierto de Ricky Martin, vemos la casa donde vive mi padre, su mujer, mi hermano y mi abuela; mi hermana que está casada con Guillermo que fue la persona con la que yo me encontré en la calle, etc.
Se puede seguir expandiendo para analizar movilidad, la gente de Quanam es muy de viajar así que voy a expandir a mis tres compañeros:

Ahora se puede apreciar donde viven, teléfonos, sus actividades, viajes, etc.

Si expandimos Madrid para intentar ver otros Movimientos “Madrid – Montevideo” nos encontramos con el viaje de Carmela Hontou, la primer paciente detectada en Uruguay y si expandimos a ella podemos ver todas sus vinculaciones:

La novedad es que el grafo muestra que en el vuelo de vuelta, la primer paciente del COVID 19 en Uruguay, lo compartió con Julieta, que es prima de Guille (mi cuñado) y que entre ellos compartieron su fiesta de recibimiento. Yo a su vez me había encontrado con Guille en la calle. De esta forma es que se puede ir construyendo una investigación sobre cómo el virus se propaga.
Una buena funcionalidad que provee la herramienta es la de poder visualizar la información como una línea de tiempo:

Con esta visualización queda más claro cómo es toda la secuencia de hechos.
A medida que se van agregando entidades y atributos al gráfico se puede hacer difícil de leer.

Por lo que es útil la posibilidad del formato condicional. En este caso podemos agrandar entidades que sean clave, por ejemplo, por ser personas de alto riesgo:

También en este sentido son útiles las medidas de centralidad (que comenté más arriba a nivel teórico) y la herramienta nos las provee de forma automática:

Se ve que la entidad más importante (con mayor valor en la medida de centralidad “vector propio”) es el casamiento al que acudió Carmela y luego gran parte de los asistentes que por ser familia están todos muy vinculados entre sí.
La última funcionalidad que pienso que merece la pena destacar en este modelo para el combate al coronavirus COVID-19, es la posibilidad de visualizar datos geoespacialmente ya que la herramienta se conecta de forma nativa con Google Earth y con ESRI:

Conclusiones

El Coronavirus COVID-19 es un virus infeccioso que, cuando se propaga, afecta a un gran volumen de la población. Es una enfermedad tiene una alta tasa de contagio, por lo que si no se «aplana la curva» el sistema de salud puede verse desbordado.
El desarrollo de aplicaciones informáticas de asistencia sanitaria está emergiendo como una solución efectiva en el combate al coronavirus COVID-19.

En este caso la prueba de concepto indica que el análisis de redes sociales (Social Network Analysis) puede ser una solución efectiva para presentar el estado del brote y analizar casos de infección.

Héctor Cotelo  @CoteloHector

Consultor en Business Analytics & Information Management

Si te pareció interesante y considerás es una solución que puede detener la propagación del COVID-19, compartí el artículo en tus redes.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *