Título de la entrada del blog

Subtítulo

Fernando Lopez
Nota previa: Se recomienda tener esta música a mano para este artículo: What I Am (Edie Brickell & The New Bohemians, 1988)
Dicen que dicen que un proverbio árabe reza:
El hombre que sabe y sabe lo que sabe, es un sabio, ¡síguelo!. El hombre que no sabe y sabe que no sabe, es simple, ¡enséñale!. El hombre que sabe y no sabe que sabe, está dormido, ¡despiértalo!. El hombre que no sabe y no sabe que no sabe, es un necio, ¡huye de él!. 
Seguramente muchos ya lo conozcan. En este artículo los invito a jugar con la idea de un predictor interno, una idea de lo que somos, cómo nos vemos. La intención es explorar con libertad el significado de lo que se predice, y los posibles errores de clasificación; no vamos a entrar en detalles de cuantificación numérica.
Antes de pasar al ejemplo, y a riesgo de pecar de reiteración para los que ya saben, comentemos algunos conceptos:
Un predictor, es un modelo o algoritmo que nos permite, en base a información con la que contamos (variables de entrada, o features), algún resultado que depende de ellas (variable de salida, o label). Este resultado puede ser una etiqueta de clasificación (label) o un objeto numérico. En el primer caso típicamente hablamos de clasificadores, y en el segundo, de regresores. Un predictor tan obvio como aleatorio es lanzar una moneda, donde el acierto de la respuesta si/no será de 50%.
Para poder evaluar qué tan bueno es nuestro predictor, necesitamos clasificar los resultados obtenidos, contra la realidad. En el caso más simple, querremos predecir si cierta propiedad se cumple (Positivo) o no (Negativo). Es decir, nuestra variable de salida sería un label binario. Entonces hablamos de:
o Positivos: son los objetos que el predictor afirma que cumplirán la propiedad que queremos predecir.
o Negativos: son los objetos que, según el predictor, no cumplirán la propiedad.
Cuando contrastamos los resultados generados por el predictor contra la realidad hablamos de:
o Verdaderos: los objetos que realmente cumplen la propiedad de interés
o Falso: los que no la cumplen
Estamos ahora en condiciones de contrastar lo predicho (Positivo, Negativo) contra la realidad (Verdadero, Falso). Esto es lo que llamamos matriz de confusión, un tópico habitual en aprendizaje máquina.
Volviendo al proverbio árabe -y ahora es buen momento para dar play al tema de Edie Brickel- imaginemos que cada individuo quisiera predecir su sabiduría, reducido al problema binario de "saber o no saber". La etiqueta Positiva, o clase Verdadera, será "sabe". Entonces tenemos esta matriz de confusión:
Odoo CMS - a big picture

De acuerdo con el proverbio, a cada situación podremos asignarle una interpretación, obteniendo el siguiente cuadro:

Odoo CMS - a big picture

En estadística, el falso positivo también es conocido como falsa alarma, o error tipo I. El falso negativo, error tipo II.
 
Finalmente, y siguiendo en el proverbio, podemos adjudicar una decisión a cada interpretación:

Odoo CMS - a big picture
Aquí podemos realizar varias afirmaciones, de acuerdo a las directivas de inferencia y el conjunto de reglas que nos sugiere el texto:
Los verdaderos positivos son ejemplos a seguir. Son lo mejor que nos puede pasar en términos de precisión (precision) y cobertura (recall).
Los falsos positivos, además degradar la precisión del predictor, deben ser evitados
Los verdaderos negativos no son conscientes de sus potencial, pero están identificados, hay que ayudarlos
y así  podríamos seguir filosofando. Para eso, los invito a escuchar Filosofía Barata y Zapatos de Goma, de Charly García (1990).


Más allá de fábulas, para saber si un predictor o clasificador funciona bien, las medidas fundamentales serán precisión y cobertura -que podemos intuir viendo la matriz de confusión- o elaboraciones sobre ellas.
En la realidad, esto se mapea casos de negocio en términos de ratios o probabilidades de eventos. Algunos ejemplos de estas probabilidades, tomados de casos en que nos ha tocado trabajar son:
situación de fraude para una transacción determinada
que un cliente se convierta en deudor próximamente
que un ítem me resulte interesante, considerando mi historia de compras
que una sintomatología configure un diagnóstico de enfermedad
que un cliente deje de serlo
en una imagen, la seguridad de identificar un objeto de una clase determinada
Dependerá del caso de negocio cómo ponderar precisión y cobertura, ya que una siempre afecta a la otra. Y también, elegir umbral de seguridad con el que queremos considerar una predicción.
Imagen de portada de Markus Spiske en Pixabay



Una buena forma de captar la atención de su lector es contarle una historia. Todo lo que considere escribir puede ser considerado una historia.

Las grandes historias tienen personalidad. Considere contar una gran historia que tenga personalidad. Escribir una historia con personalidad para clientes potenciales ayudará crear una conexión. Esto se muestra en los pequeños detalles como la elección de las palabras o las frases. Escriba desde su punto de vista, no desde la experiencia de otro.

Las grandes historias son para todos incluso cuando se han escrito sólo para una persona. Si intenta escribir una historia con una audiencia amplia en mente, su historia sonará sosa y falsa. Nadie resultará interesado. Escriba para una persona. Si es genuino para uno, es genuino para el resto.