Decisiones sobre el futuro: modelos predictivos
En una economía donde la única certeza es la incertidumbre, la única fuente de una ventaja competitiva duradera es el conocimiento.
Ikujiro Nonaka
En general, cuando hablamos de sistemas de información nos referimos a información o datos, transacciones que ocurrieron en el pasado o, en el mejor de los casos, en el presente. Podemos avanzar en la dimensión temporal y referirnos a transacciones que ocurrirán en el futuro; para lo cual debemos introducir la disciplina estadística en forma complementaria a la informática. Y si a esto le sumamos otra dimensión como ser el espacio, o sea donde ocurren esas transacciones (en qué departamento, en qué ciudad), el análisis se vuelve más interesante.
Pero aún más interesante será sí incluimos una dimensión adicional, por ejemplo, la demográfica o la económica, para lo cual podemos usar la información recabada por el censo de población o por las encuestas de ingreso de los hogares. Con estas dimensiones tenemos un análisis significativamente más rico: considerando los valores de los datos del pasado y del presente, podremos predecir qué ocurrirá en el futuro.
Algunos ejemplos.
– Comportamiento de la demanda por situación geográfica y económica dado un cierto conjunto de servicios o bienes a ofrecer.
– Análisis de la evolución de las tasas de delincuencia por tipo de delito por barrio, ciudad, departamento, y/o sexo.
– ¿Cuáles serán los clientes o contribuyentes que entrarán en una situación de morosidad en el próximo semestre, o en el próximo año?
– Dada la evolución demográfica del país, ¿cuáles serán las necesidades de infraestructura de los pobladores para tenerlas en cuenta para la planificación urbana, por barrio, por ciudad, por departamento?
– ¿Cómo evolucionará mi portafolio o conjunto de productos y/o servicios, impuestos o ingresos por zona geográfica y por quintil de ingreso, u otra estratificación de la población bajo consideración?
Para construir mi modelo predictivo debo considerar toda la información, todos los datos que tenga disponible la organización en función a transacciones ya cerradas, como por ejemplo los ingresos percibidos por ventas, por la recaudación de impuestos o contribuciones a la seguridad social, etc.
También debo considerar variables o datos externos a la empresa, por ejemplo: datos estadísticos de INE, ingresos de las familias, etc.
Es factible introducir variables de datos provenientes de las redes sociales y de información disponible bajo Internet en general (Big Data).
Esta es otra dimensión de la información, por su origen: sistemas internos, sistemas externos.
Minería de datos
Al análisis de qué variables considerar para el modelo predictivo se lo denomina “minería de datos” el cual tiene varias fases necesarias que son, esencialmente:
• Comprensión: del negocio y del problema que se quiere resolver
• Determinación, obtención y limpieza: de los datos necesarios
• Creación de modelos matemáticos
• Validación, comunicación: de los resultados obtenidos
• Integración: si procede, de los resultados en un sistema transaccional o similar
La relación entre todas estas fases sólo es lineal sobre el papel. En realidad, es mucho más compleja y esconde toda una jerarquía de subfases. A través de la experiencia acumulada en proyectos de minería de datos hemos desarrollado metodologías que permiten gestionar esta complejidad de una manera razonablemente uniforme.
Nuestra experiencia muestra que aplicar metodologías, aproximaciones multidisciplinarias y/o transversales enriquece mucho o mejora la calidad de los sistemas de información y viabiliza la obtención de resultados de alto valor.
Alfredo Halm
Socio Fundador de Quanam
Contador Público, Licenciado en Administración/ Ingeniero de Sistemas en Computación.
Ex catedrático de Sistemas Computacionales de la Facultad de Ciencias Económicas de la Udelar