Música cognitiva: ¿el nuevo hit del verano?

.

Hector Cotelo

Durante enero del 2016 estaba de vacaciones en Piriápolis y mientras escroleaba el feed de twitter me encontré con un post del MIT Technology Review que planteaba la incógnita sobre si una inteligencia artificial sería capaz que escribir discursos políticos. Para mi asombro, le respondían afirmando que un tal Valentin Kassarnig de la University of Massachusetts le había enseñado a un algoritmo a escribir discursos.

En Quanam no estamos todo el tiempo trabajando en proyectos de clientes. Muchas veces dedicamos tiempo a investigar, estudiar e intentar innovar en temas que sirven al negocio pero que sobre todo son de interés para el consultor. 

En esas horas me puse a investigar un poco el estado del arte del Procesamiento de Lenguaje Natural (NLP por su sigla en inglés) área que vincula campos de la lingüística e informática con metodologías de Machine Learning e Inteligencia Artificial para extraer información de valor de textos (y hasta audios) en lenguaje "humano". 

Como además de la informática tengo como pasión la música, ahondé en técnicas como n-gramas, etiquetado gramatical (part-of-speech tagger), desambiguación léxica (Sliding Window), programación genética, arte generativo y arte algorítmico para ver si de alguna forma me podían ayudar a enseñarle a una computadora a escribir canciones.

Investigando un poco vi que ya existen varios esfuerzos por intentar que las computadoras compongan canciones. Por ejemplo el proyecto Iamus de la Universidad de Málaga, Wolfram Tones, Flow Machines (Sony CSL) e incluso en el último evento organizado por IBM Uruguay pudimos escuchar a Watson tocar música cognitiva. De todos modos yo quería enfocarme no tanto en la música sino en la letra y quería algo bien local, algo como la cumbia pop.


Para la prueba de concepto programé una inteligencia muy básica y la alimenté con 72 canciones de bandas como: Rombai, Márama, el Reja, el Gucci, Monterrojo, Los Fatales, entre otros. 90 megas de texto plano agrupados en versos y estrofas. Parece mucho pero en realidad no es tanto (¡Kassarnig usó 4.000 discursos!).
De todas formas creo que sirvió para demostrar que la idea no es inviable. Acá va el resultado de una de las corridas:

Odoo text and image block

¿Podrá llegar a ser el hit del verano 2018?
En próximos posts intentaré explicar cómo funciona el algoritmo.

Héctor Cotelo
Ingeniero en Informática, PMP
Especialista en Business Analytics.