¿Cuál sería el diseño ideal de la camiseta alternativa de Uruguay?

Tras la cantidad de críticas y sobre todo memes que recibió la última camiseta alternativa de Uruguay, surgió la idea de que variantes se le podían hacer. Para esto me basé en cinco herramientas de generación de imágenes a partir de texto DALLE, Craiyon (ex DALLE mini),  Midjourney , NightCafe y Dream Studio, de donde surgieron algunos diseños más, de la ya oficial camiseta.

Antes de mostrar los resultados obtenidos por cada una, una breve introducción de cómo funcionan los modelos de texto a imagen.

Si bien varían la arquitectura y la información con la que son entrenados, estos modelos funcionan con una lógica bastante similar, a grandes rasgos diremos que tienen un modelo de lenguaje y otro de imagen.

El modelo de lenguaje lo que hará será asignarle un código (token) a cada palabra, este proceso es conocido como encoding, así entenderá el sistema lo que nosotros le escribimos. Tanto DALLE mini como DALLE 2 usan un sistema llamado CLIP, este sistema no solo se queda con las categorías con la lista de categorías pre definidas sino que es capaz de identificar nuevas categorías sin participación humana. Otra de las ventajas que tiene es que genera un diccionario donde asocia una palabra con una imagen.

The architecture of unCLIP. (Image source: Ramesh et al. 2022])

Por el otro lado tenemos el modelo de imagen. En su blog, Daniel Fein describe este proceso como armado de un cubo de Rubik, ya que luego del encoding y posterior decoding, lo que queda es una nube de pixels, a partir de ahí el modelo busca reconstruir la imagen hacía lo que debería ser el resultado final.

El fin de estos modelos no es solo hacer imágenes divertidas, sino buscar tener una aplicación comercial. El principal uso que se les ha dado es el de generar prototipos de productos, participar del proceso creativo o insumos para marketing como fue la portada de Cosmopolitan creada por DALL-E2.

Luego de esta breve presentación de cómo funciona el modelo, ahora sí, lo importante, la nueva camiseta alternativa de Uruguay.

Todos los resultados obtenidos fueron colocando “Uruguay football away shirt”, “Uruguay football away white shirt” o “Uruguay football away red shirt”

A continuación les mostramos los resultados obtenidos:

Craiyon o DALLE-mini se caracteriza por generar imágenes no tan exactas o detalladas, pero si muy creativas.

DALL-E logra un resultado más real y preciso

Midjourney tiene por defecto un look más artístico que para mi logra los mejores resultados:

Y, por último, porque sabemos que hay algunos defensores de la alternativa roja

Night Cafe y Dream Studio están basado en un modelo llamado Stable Diffusion que fue liberado recientemente.

Night Cafe

Dream Studio con Stable Diffusion V1.5

¿Cuál herramienta les gusta más usar? ¿Creen que los resultados fueron mejores que la camiseta alternativa oficial de Uruguay?

Bibliografía:

DALL-E Mini Explained

DALL-E 2.0, Explained

How does dalle-mini work?

Pablo Molina
Consultor Data & Analytics