Context Engineering: un dato correcto puede llevar a la conclusión equivocada
Una respuesta rápida no es lo mismo que una respuesta buena. Y la IA, por sí sola, no sabe la diferencia.
En el análisis de datos, el error más peligroso no ocurre cuando los números están mal, sino cuando el contexto está incompleto. Este artículo explora por qué el promedio miente, qué es Context Engineering y cuál es el rol del analista en la era de la IA.
El problema no estaba en los datos
Preparando un webinar sobre análisis de datos e inteligencia artificial, algo interrumpió la lógica inicial del contenido. La idea de partida era mostrar cómo la IA acelera las decisiones. Pero al construir los ejemplos, apareció una incomodidad más interesante: en muchos casos, el problema no estaba en los datos ni en el modelo. Estaba en el contexto que faltaba.
Eso cambió completamente el enfoque.
Un caso aparentemente obvio
Consideremos una situación concreta. Un hospital compara dos antibióticos:
- Antibiótico A → 82,7% de éxito
- Antibiótico B → 40,8% de éxito
La conclusión parece inmediata: A es mejor. Si le presentamos esos datos a un modelo de IA, probablemente llegue a la misma conclusión.
Y ahí aparece uno de los problemas más incómodos del análisis asistido por IA: el modelo no estaba equivocado. Estaba incompletamente informado.
Cuando los mismos datos se analizan separados por gravedad de la infección, el resultado se invierte. En pacientes leves, B era mejor. En pacientes graves, B también era mejor. ¿Cómo podía A aparecer como superior en el total general?
Los grupos no estaban equilibrados. A había tratado muchos pacientes leves; B había tratado muchos pacientes graves. El promedio mezclaba contextos distintos. Los números eran correctos. Lo que fallaba era asumir que el total comparaba exactamente lo mismo.
Esto es la Paradoja de Simpson: una tendencia que aparece en datos agregados puede revertirse o desaparecer al analizar los subgrupos por separado.
El problema no es académico
Cuando se habla de sesgos estadísticos, la reacción frecuente es imaginar un problema técnico y lejano. El caso de la Universidad de Berkeley ilustra por qué ese supuesto es erróneo.
La universidad fue acusada de discriminar mujeres en su proceso de admisión. El total general parecía confirmarlo. Pero al analizar los datos por departamento, la historia cambiaba: las mujeres elegían mayoritariamente las carreras con mayor competitividad de acceso. El sesgo aparente en el agregado desaparecía cuando se incorporaba esa variable de contexto.
El dato aislado no mentía. Mentía el contexto que faltaba.
La IA no sospecha de lo que no sabe
Al trasladar este tipo de situaciones al análisis con inteligencia artificial, el riesgo se amplifica por una razón específica: la IA responde con seguridad, incluso cuando la pregunta está mal formulada.
La velocidad de respuesta puede generar una ilusión de profundidad que no siempre existe. Los modelos de lenguaje no cuestionan automáticamente los datos recibidos, no detectan variables ausentes y no comprenden causalidad del modo en que lo hace un analista con experiencia. Hacen exactamente lo que se les pide. Eso es una virtud y una debilidad al mismo tiempo.
Un ejemplo ilustra el punto. Ante este pedido: «Tengo datos de productividad antes y después de un entrenamiento. ¿Qué análisis puedo hacer?», la IA podría sugerir una prueba t para muestras independientes. La respuesta suena correcta. Pero puede ser estadísticamente equivocada, porque el modelo no sabe si se están comparando personas distintas o las mismas personas en dos momentos. Ese detalle cambia el análisis por completo.
La respuesta no era absurda. Simplemente faltaba contexto.
Context Engineering: pensar antes de preguntar
Este problema no nació con los modelos de lenguaje. Quienes trabajaron durante años con análisis de datos reconocen la dinámica: un usuario solicita un análisis con una idea clara en su cabeza, pero al momento de explicarlo entrega apenas una parte de la historia. El analista trabaja con lo que recibió.
Con la IA ocurre lo mismo. Solo que ahora sucede en segundos, y la respuesta llega con una apariencia de autoridad que inhibe el cuestionamiento posterior.
De ahí la importancia del Context Engineering: el proceso de estructurar y entregar a la IA toda la información necesaria para que interprete correctamente los datos. No se trata de escribir prompts más largos. Se trata de pensar mejor antes de preguntar:
- ¿Qué problema estamos intentando resolver?
- ¿Qué datos estamos mezclando sin darnos cuenta?
- ¿Qué variables podrían estar faltando?
- ¿Qué decisión depende de este análisis?
La habilidad que más importa
Preparar este contenido dejó una conclusión incómoda pero clara. Muchas veces se utiliza la IA buscando velocidad, y la velocidad puede reemplazar el cuestionamiento. Una respuesta que aparece rápido parece correcta.
Pero una respuesta rápida no es necesariamente una buena respuesta.
Sherlock Holmes no resolvía casos porque miraba rápido. Los resolvía porque sabía detectar lo que faltaba. En el análisis de datos con IA, esa capacidad, saber sospechar del dato antes de aceptarlo, es probablemente la habilidad más difícil de delegar.
Cuando el contexto falta, los datos engañan. Cuando los datos engañan, las decisiones también.
Sigamos charlando.
¿Tu equipo ya se encontró con análisis que parecían correctos pero no terminaban de cerrar? Contame tu experiencia y exploremos cómo el Context Engineering puede mejorar la calidad de las decisiones en tu organización.
Ivete de Barros
Consultora y Formadora en Análisis de Datos