RADAR_
DOMINAR EL
ALGORITMO
¿Quién nos recomienda las canciones? Hablamos con el compositor y científico de datos Sergio Oramas ‘Muyaio’
POR EMILIO R. CASCAJOSA
Las recomendaciones sobre qué canciones deberíamos escuchar son cada vez más precisas y están más personalizadas. Las plataformas de streaming, grandes valedoras de la difusión masiva de repertorios musicales, utilizan algoritmos diseñados para acertar no solo con tus gustos, también con tu franja horaria, el lugar en el que vives o el estado de ánimo en el que te encuentras cuando le das al play. Todo esto de manera inmediata y comprimido a 320 Kbps.
Sergio Oramas es músico, formó parte de la banda Supertrópica y adopta ahora el nombre artístico Muyaio cuando le da por componer canciones a medio camino entre el folk sicotrópico de Devendra Banhart y la ironía dadaísta de Albert Pla. En definitiva, es un autor peculiar. No en vano, cuenta con una licenciatura en Musicología y una especialización en Composición de Jazz. Pero su historia va a más. Inquieto amante de los sonidos selváticos, Oramas empezó a programar con apenas siete años hasta que a los catorce descubrió la música y esta le borró de un plumazo toda pasión por la informática. Cosas de la edad. Afortunadamente, el tinerfeño acabó cediendo a la presión familiar y ahora puede vacilar de tener una licenciatura en Ciencias de la Computación y de trabajar como científico en Pandora/SiriusXM, líder en entretenimiento de audio en EE UU. También ha sido profesor adjunto de Machine Learning en la Universidad Pompeu Fabra y colabora cada año en la organización de Sónar+D, aunque realmente contactamos con él como creador de algoderitmo.com, una web para descubrir artistas independientes con un algoritmo de recomendación más justo. Y es que, aunque invierta la mayor parte de su tiempo trabajando para un gigante tecnológico, Serio Oramas esconde dentro un verdadero activista de la democratización digital.
Sergio Oramas es Muyaio, músico y data scientist
Tengo 52 años, un coche coreano y me encanta The Velvet Underground. Si con estos datos tuvieras que recomendarme una banda española, ¿cuál sería y por qué?
Pues Los Planetas. Primero por la similitud sonora que hay entre las dos formaciones, siendo además conocido que Velvet Underground son una influencia fundamental para Los Planetas. Segundo, por tu edad, perfecta para haber vivido el comienzo de esa banda en la segunda mitad de los 90. Lo que menos información me da es lo del coche, aunque un modelo coreano me da arroja el dato clase media y Los Planetas encajan bien en ese sector demográfico.
Vaya, pues siento contradecir a tu algoritmo personal, pero no soy muy fan de Los Planetas.
Es que solo me diste un input [risas].
Has tenido una evolución muy curiosa. Con apenas siete años eras un freak de la informática y a los catorce descubriste la guitarra y abandonaste la programación. Al final, acabaste haciendo la carrera de Informática para luego pasar a estudiar música en profundidad.
He tenido épocas en las que he estado más centrado en la música y etapas más volcadas en la informática. A los 32 me dieron una beca de doctorado para ir al Music Technology Group de Barcelona. Entonces decidí dejar la música de lado para centrarme en la inteligencia artificial y así reconecté con la informática. Me saqué el doctorado, escribí un montón de artículos y empecé a trabajar para Pandora. Una vez logrado todo esto, llegó la pandemia, que cambió las cosas y de nuevo relancé mi carrera artística con un nuevo proyecto: Muyaio.
“El algoritmo”, probablemente el anti-hit más sonado de Muyaio
Trabajas como científico de datos y te habrá pillado de lleno el hype del algoritmo. La gente lo cita como si fuera un ente superior que conoce tus gustos, cuando realmente se trata de un conjunto de instrucciones ordenadas para procesar datos y solucionar problemas. ¿Estamos mitificando en exceso?
Sin duda. Un algoritmo de personalización es una máquina de operaciones estadísticas capaz de calcular la probabilidad de que te guste una canción u otra, por ejemplo. El cálculo se basa principalmente en los patrones de escucha de millones de usuarios y cuantos más, mejor funcionará. Pero estos algoritmos tienen puntos débiles, tienden a recomendar pocas canciones, son repetitivos, tienen sesgos y están optimizados para que pases el mayor tiempo posible en la plataforma, no para que crezcas como persona o ayudarte a conocer otros géneros o artistas. Sufren la tiranía de la mayoría y la mayoría es probablemente diferente a ti.
“El problema es que gran parte de los oyentes no quieren descubrir música y el algoritmo de toda la vida les funciona. Al final la mayoría es la que manda”
Parece que ahora se trata más de acumular datos de muchos perfiles similares en vez de dejarse llevar por ese colega melómano que te conoce y que sabe lo que podría gustarte. ¿Dónde quedó aquello de que el deep learning nos haría más libres?
Es lo que te comentaba, la tiranía de la mayoría. Los gustos se aplanan porque el algoritmo no está suficientemente personalizado, no te conoce lo suficiente. Realmente, el deep learning es lo que ha venido para salvarnos de eso. El mejor algoritmo de recomendación y que aún se usa mucho es el llamado matrix factorization, que ya estaba ahí antes que el deep learning y se basa solo en los patrones de escucha. El aprendizaje profundo, sin embargo, permite que para recomendar usemos cosas más allá de los patrones de escucha, combinándolos con el audio de las canciones, con las letras, con los metadatos. El problema es que gran parte de los oyentes no quiere descubrir música y el algoritmo de toda la vida, el matrix factorization, les funciona de perlas. Al final la mayoría es la que manda.
Como artista buscas abrirte camino en el océano de músicos emergentes. Para eso creaste tu propia arma: un algoritmo justo de recomendación musical.
Mi objetivo en el campo de la recomendación musical ha sido conseguir ayudar a artistas como yo para que puedan encontrar su público potencial. Lo he perseguido desde mi tesis doctoral, que iba sobre este tema, hasta mi trabajo actual en Pandora, donde trato de promover este tipo de enfoque. Por eso hice algoderitmo.com, para poder probar uno de estos algoritmos más justos.
¿Y cómo funciona esa web?
La diseñé con un objetivo egoísta: la promoción de mi canción “El algoritmo”. Digamos que me dije: ¿cómo podría mi yo científico, con un cierto estatus y reconocimiento, ayudar a mi yo artista, un pobre autor emergente ahogado en un mar de creadores? Y se me ocurrió montar un site para descubrir otros artistas emergentes haciendo lo que mejor se me da, un algoritmo de recomendación. En la web tú eliges un artista famoso que te guste y mi algoritmo te crea una playlist de nuevos artistas españoles similares al que has seleccionado. Y esa similitud se basa en una red neuronal que analiza el audio de las canciones del artista y las convierte en ese número mágico que pongo en el mapa.
“Playa de Benidorm”, otra de las canciones más “recomendadas” de Muyaio
Actualmente trabajas para una gran empresa como Pandora, un servicio de streaming musical con más de 50 millones de usuarios en EE UU y una radio por satélite que funciona en casi todos los automóviles del país. ¿No es mucha responsabilidad?
Bueno como somos unos cincuenta científicos trabajando allí, mi responsabilidad se diluye en el equipo. De hecho, cuesta que mis ideas acaben en el producto. Siempre trato de empujar para crear algoritmos que mejoren la recomendación de artistas emergentes, artistas long-tail, como los llamamos, y de hacer herramientas para dar el control de la recomendación al usuario. Pero estas dos cosas son difíciles de incluir en un producto consolidado con más de 50 millones de oyentes. Cualquier implementación tiene que estar supermedida y no debería afectar a la gran métrica por antonomasia, las horas en total que se consumen en la plataforma. Puede resultar que mi algoritmo sea la maravilla para el 10 % de los oyentes, pero al resto no le va a funcionar.
Tendrás entonces algoritmos para dar y regalar
Uf, me dedico a muchas cosas diferentes. Tengo algoritmos que analizan el audio, los patrones de escucha y los metadatos para extraer de todo eso un número mágico, un vector de coordenadas capaz de colocarme una canción o un artista en un mapa. Y para entrenar esos algoritmos tengo que programar, recopilar datos y prepararlos para entrenarlos, crear datasets donde evaluar qué tal funciona mi historia o ver qué puedo hacer para mejorar los resultados, los propios datos o la arquitectura de la red neuronal. Es una labor de ingeniería con computación en la nube, big data básicamente.
Sergio Oramas, demasiadas horas frente al monitor
¿Hasta qué punto puede llegar un algoritmo a saberlo casi todo de ti?
Hasta el punto que tú le dejes. Si nos ceñimos solo a la música, si todo lo escuchas en una misma plataforma, es probable que pueda saberlo todo, aunque a lo mejor no te está dando todavía la mejor recomendación, pero pronto lo hará. No es un problema resuelto del todo esto de la recomendación, porque los algoritmos siguen mejorando y conociendo mejor al usuario. Fuera de la música la cosa se pone un poco más creepy, y es cierto que pueden saber demasiado de ti si le sumas redes sociales, operaciones bancarias, búsquedas en internet, etcétera. Es lo que hace Tencent en China.
“A veces los algoritmos también exploran y te dan un poco de aleatoriedad, para así probar qué tal funciona una canción nueva”
¿Dónde queda entonces la excentricidad cuando entra en acción el algoritmo?
Bueno, el algoritmo tiene en cuenta lo que hace el usuario, así que, si el usuario es excéntrico, tratará de darle lo que quiere. Todo depende de lo bien armado que esté el sistema. A veces los algoritmos también exploran y te dan un poco de aleatoriedad, para así probar qué tal funciona una canción nueva, por ejemplo. Esos momentos de espontaneidad se hacen con unos algoritmos llamados multi-armed bandits, que tienen más que ver con el sistema de las tragaperras, en el que simplemente le das a la palanca y esperas a lo que salga. Netflix, por ejemplo, usa mucho estos algoritmos.
¿Cuáles serían, a grandes rasgos, los mecanismos para crear una playlist de tus favoritos del mes?
Un usuario tiene normalmente variosclústeresde gustos. Como los Daily Mix de Spotify, que representan diferentes clústeres. El mecanismo es fácil. Como te dije antes, cada canción la representamos como unas coordenadas en un mapa de, a lo mejor, mil quinientas dimensiones. Se cogen todas las canciones que le gustan al usuario y se ponen en ese mapa, y se mira a ver cómo de cerca están unas de otras. Un conjunto de canciones cercanas en ese mapa es un clúster, quepuede representar un género o varios géneros similares, o un estado de ánimo, o una década, o una combinación de varias cosas.
¿Y para qué se optimiza el algoritmo?
Por lo general para que pases el mayor tiempo posible dentro de la plataforma, pero esta es una métrica cortoplacista. Ahora se están investigando mecanismos para optimizar la satisfacción del usuario a largo plazo, es decir, para que sigas usando la aplicación durante más días y no la abandones. Hay artículos que han demostrado que fomentar el descubrimiento mejora estas métricas a largo plazo, aunque parezca que las empeore a corto plazo. Netflix o Spotify están avanzando mucho en este sentido.
Un domador de algoritmos en busca de recomendación
¿En qué medida podría predecir un algoritmo un posible hit musical?
Con un algoritmo que solo use patrones de escucha sería imposible. Habría que utilizar uno híbrido que analice otras cosas, como el audio y los metadatos. Pero, aun así, se trata de un problema muy complejo. No sabría decirte si sería posible predecir un hit solo desde el audio, hay muchos factores que pueden influir, aunque existan empresas por ahí que vendan la moto de que pueden predecir si una canción será un éxito o no, yo no me lo creo.
“El algoritmo ignora lo que no es escuchado porque se basa principalmente en patrones de escucha. Si algo no se reproduce, no existe para él”
Desde un punto de vista prescriptivo, ¿podría usarse un algoritmo para modelar un posible éxito con un objetivo preestablecido?
Ese es un muy buen apunte, y creo que sí. Por ejemplo, ahora YouTube da recomendaciones a los creadores de contenido sobre qué tendrían que cambiar en sus vídeos para llegar a más público. Eso mismo podría hacerse con la música. Al final, tanto las canciones como los usuarios se pueden pintar en un mapa; así veríamos qué movimiento tendría que hacer una canción para acercarse a donde hay más usuarios y podríamos ponerle palabras a ese movimiento usando IA generativa o sonido.
¿Y hay algo que se le escape?
Bueno, el algoritmo ignora lo que no es escuchado porque se basa principalmente en patrones de escucha. Si algo no se reproduce, no existe para él. Hay millones de canciones en el catálogo que no se escuchan, o que se escuchan poquísimo, mientras que unas pocas canciones se llevan la mayoría de los streams y el algoritmo estándar magnífica esto.
Eres un activista a favor de una recomendación justa y a la vez trabajas en una big tech. ¿Te sientes como un caballo de Troya del sector?
Un poco sí [risas]. Siempre empujo desde dentro para que usemos algoritmos más justos, para que tengamos métricas que sirvan para que más artistas sean recomendados, poniendo el foco en los creadores y en dar más poder a los propios usuarios para controlar los algoritmos. Esos son mis caballos de batalla. Si estoy en una big tech tengo más posibilidades de lograr un impacto con mis ideas.
¿Hacia dónde vamos encaminados en lo referente a las recomendaciones de cultura y ocio?
Estamos entrando en un escenario completamente nuevo con la IA generativa. Es posible que muy pronto empiece a crearse contenido hiperpersonalizado, perfectamente ajustado a los gustos, el contexto y el estado de ánimo de los usuarios. Hablo de contenido generado con IA. Será una parte del mercado, igual que ahora hay mucha gente que consume música sin importarle quién es el artista. Aunque, por otro lado, la gente querrá seguir sintiéndose conectada con el artista, y no creo que esa figura vaya a desaparecer. La IA es una herramienta muy potente y la veremos aparecer por todos lados, desde la producción a la composición o la promoción. Ahora mismo nos encontramos en la tierra de las oportunidades y tenemos que subirnos al carro.
Para acabar, ¿algún objetivo por cumplir, como músico y como científico de datos?
Musicalmente, muchísimos. Todavía soy un artista emergente, me quedan bastantes peldaños por subir, escenarios en los que tocar y colaboraciones por hacer. Espero poder abandonar algún día el mar infinito de artistas emergentes y llevarme conmigo a muchos compañeros. Como data scientist me quedan menos cosas por cumplir, pero me gustaría resolver el problema del long-tail, y ver cómo mis ideas sobre los algoritmos más justos y el mayor control de las recomendaciones por parte de los usuarios llegan al producto y lo dominan. Si no soy capaz de conseguirlo desde la empresa en la que trabajo, tendré que hacerlo en la que quizás funde algún día.
Fotografías
Carla di Girolamo (apertura)
Chiara Dall'Olio
Enlaces
!!!!!!!!!!!!!!!!!!!!
HOMENAJE A PASCUAL MOLONGUA
La Fundación SGAE, a través del Consejo Territorial de SGAE en Euskadi, prepara un concierto de homenaje a Pascual Molongua. La recaudación (incluida Fila 0) irá destinada a apoyar a este autor y artista, a punto de cumplir 74 años, que canta desde los 16. Será de la mano del Ayuntamiento de Bilbao, en la Sala Bilborock, el 28 de diciembre.
La gala estará llena de sorpresas y saludos. Actuará en directo el propio Pascual Molongua, pero también el trío de José Luis Canal, Gontzal Mendibil y el grupo percusivo Novisi Elkartea. Conducirá el evento la actriz y cantante Afrika Bibang.
Donación mínima 8€ y compra exclusiva en www.eventbrite.es