La IA está ampliando los sesgos de la industria musical (columna invitada)

África, Oriente Medio y el sur de Asia representan aproximadamente la mitad de la población mundial y también albergan cientos de tradiciones musicales distintas. Pero en los conjuntos de datos de entrenamiento más comúnmente utilizados para construir modelos de IA musical, la música de África representa solo el 0,3%, la de Medio Oriente: el 0,4% y la del sur de Asia el 0,9%, mientras que los géneros occidentales representan el 94%.

Estas cifras provienen de investigadores de la Universidad de Inteligencia Artificial Mohamed bin Zayed de Abu Dhabi, quienes examinaron los conjuntos de datos de entrenamiento detrás de las herramientas de música generativa actuales y presentaron los hallazgos en el Capítulo 2025 de las Naciones de las Américas de la Asociación de Lingüística Computacional (NAACAL).

Cuando esos modelos intentaron generar música en la tradición de una raga india, optaron por un sitar que tocaba estructuras tonales occidentales, produciendo algo que sonaba occidental con un instrumento indio encima. El mismo estudio probó el Makam turco, un sistema melódico construido sobre intervalos que no existen en un piano occidental. Una vez más, los modelos aplanaron esos intervalos hasta alcanzar el tono occidental estándar. Cuando los investigadores alimentaron al modelo con grabaciones adicionales de música clásica indostánica y makam turca para corregir el sesgo, su producción creativa en realidad empeoró. Los datos de entrenamiento occidentales eran demasiado dominantes para anularlos.

Este estudio confirma que el problema va más allá de la subrepresentación, ya que los sesgos incrustados en décadas de datos musicales ahora se incorporan a sistemas de inteligencia artificial entrenados con esos datos. Y son estos sistemas los que darán forma a lo que se escuche, se pague y se promueva en los años venideros.

Relacionado

Los conjuntos de datos que impulsan la industria de la música han sido moldeados durante décadas por quién firmó, qué mercados se consideraron dignos de seguimiento y qué géneros recibieron inversión. La infraestructura industrial se construye en torno a sectores particulares del negocio y se trata como si representara el conjunto. Durante mucho tiempo, esas lagunas permanecieron silenciosas en las bases de datos administrativas y las consecuencias fueron lentas. Ahora esas lagunas se encuentran en los datos de capacitación y los sistemas construidos sobre ellas funcionarán en el futuro previsible.

El sesgo se extiende al género. En 2025, las mujeres representaban el 14,5% de los compositores del Billboard Hot 100 y sólo el 4,4% de los productores, según el Iniciativa de inclusión Annenberg de la USCque ha estado siguiendo estos números durante más de una década. Esas cifras apenas han cambiado desde 2012. Los algoritmos están aprendiendo de una base que no refleja lo que la gente quiere escuchar, sino más bien lo que ya es popular, promocionado y reproducido a escala. Luego, esas salidas se devuelven directamente al bucle. Una canción agregada a Today's Top Hits de Spotify genera millones de transmisiones, lo que le indica al algoritmo que es popular, lo que genera más recomendaciones y genera más transmisiones.

Para los artistas independientes, las escenas emergentes y la música no occidental, el ciclo funciona al revés: menos datos, menos visibilidad, menos recomendaciones. Una encuesta de 2024 publicada por MediaFutures y la Universidad de Bergen, Noruega, confirmó que el sesgo de popularidad es una de las formas más persistentes y mejor documentadas de injusticia algorítmica en los sistemas de recomendación.

Nada de esto comenzó con la IA. Los problemas de metadatos se han ido acumulando durante años y se agrupan en áreas previsibles: alrededor de artistas independientes, catálogos no occidentales y cualquier cosa publicada fuera de los principales sellos discográficos. A principios de 2026, la Asociación de Música Electrónica (AFEM) encuestó a 22 empresas de tecnología musical. La mitad identificó metadatos conflictivos entre las bases de datos como su mayor desafío estructural, y el 41% señaló la ausencia de identificadores universales de artistas y canciones.

La industria tiene el hábito profundamente arraigado de publicar música primero y clasificar los datos después. Una pista viaja del artista al distribuidor, al DSP y a la sociedad de cobranza, y en cada transferencia, algo puede salir mal. Metadatos rotos significa que todo está roto: recomendaciones incorrectas, regalías incorrectas, datos de capacitación incorrectos. La Base de datos de repertorio global intentó solucionar este problema en 2014, pero fracasó, ya que las organizaciones de derechos de interpretación no pudieron ponerse de acuerdo sobre la gobernanza. Las instituciones protegen lo que les da poder y esa tensión no ha desaparecido.

Relacionado

Lo que ha cambiado es la velocidad de la desigualdad. Deezer dice que ahora recibe aproximadamente 75.000 pistas totalmente generadas por IA cada día. En abril de 2026, eso representa el 44% de todas las cargas nuevas a la plataforma (como referencia, en enero de 2025, el servicio de transmisión afirmó que era solo el 10%; en noviembre, dijo que había saltado al 34%). Un estudio conjunto realizado por Deezer e Ipsos a fines de 2025 encontró que el 97% de los oyentes no podían decir si una pista fue generada por IA o creada por humanos.

Ahora bien, no es la calidad sino el volumen lo que filtra la música. Spotify informó que eliminó más de 75 millones de pistas spam en los 12 meses previos a septiembre de 2025, y Deezer dijo que encontró que el 85% de las transmisiones de pistas generadas por IA eran fraudulentas. Las plataformas son de extinción de incendios. Cuando las cifras de carga se duplican en menos de un año, los sistemas de recomendación responden de la única manera que pueden: apoyándose más en los recuentos de reproducciones existentes, los guardados y el historial de colocación de listas de reproducción.

Como tal, las pistas con impulso obtienen más impulso, mientras que las que no lo tienen desaparecen más rápido. Así es como el sesgo empeora.

El volumen de la música generada por IA tampoco llega de manera uniforme. Los artistas establecidos tienen autoridad cultural y audiencias leales. Los artistas que se ven presionados son los que están en el medio: productores con una pequeña base de fans, artistas de sellos independientes que han estado construyendo una comunidad durante años. Están presionados desde abajo por un piso ascendente de música artificial técnicamente aceptable y desde arriba por sistemas de recomendación que recompensan lo que ya tiene tracción. La encuesta de creadores de UK Music de 2025 captó el estado de ánimo entre los creadores: el 66% dijo que la IA amenaza sus carreras, el 92% quiere etiquetas y el 93% quiere que las empresas de IA paguen cuando usan composiciones para capacitación.

También hay un problema de descubrimiento que no se analiza lo suficiente. Chartmetric, la plataforma de exploración de A&R más utilizada, rastrea más de 12 millones de perfiles de artistas. Sodatone, Soundcharts y herramientas similares de Warner Music se basan en los mismos grupos de datos sociales y de streaming. Si cada equipo de A&R utiliza las mismas herramientas algorítmicas de exploración en conjuntos de datos superpuestos, cualquier artista que esas herramientas saquen a la superficie, por definición, ya habrá generado suficientes datos para ser “descubierto”. Mientras tanto, el talento genuinamente temprano, los artistas que graban en dormitorios o estudios comunitarios, existen en espacios donde estas plataformas no tienen alcance.

Relacionado

Las consecuencias financieras de este sistema fallido pueden ponerse en contexto: Fair Play, una auditoría independiente del Reino Unido. Regalías de clubes nocturnos publicado en noviembre de 2025, analizó cómo se calculan las regalías de interpretación para la música electrónica. El método que tiene más peso extrapola datos de seguimiento extraídos casi en su totalidad de clubes comerciales o obras de radio. Lugares underground, productores independientes y música que viaja fuera de la corriente principal: todo ello se mide con una muestra que nunca fue diseñada para incluirlo. Según la auditoría, sólo el 36% de las actuaciones de música electrónica en clubes nocturnos del Reino Unido dan lugar a que se pague al creador correcto. Se estima que cada año 5,7 millones de libras van a parar a las personas equivocadas, sólo en los clubes nocturnos.

Aunque el hallazgo es específico del Reino Unido y de la música electrónica, la lógica sigue siendo válida. Dondequiera que un sistema se basa en monitorear un subconjunto del mercado y aplicar esos hallazgos al conjunto, la muestra se convierte en el estándar, y todos los que están fuera terminan subsidiando a todos los que están dentro.

Estos desafíos también afectan directamente qué productos se desarrollan. La misma encuesta de AFEM encontró que el 29% de las empresas de tecnología musical se alejaron de su visión original del producto porque la infraestructura de datos y derechos hizo imposible la idea original. La mitad de los encuestados dijo que más del 50% de sus recursos de ingeniería se destinan a soluciones alternativas en lugar de desarrollar el producto real.

El sesgo en los datos musicales no es nuevo. Ahora, sin embargo, se está integrando en sistemas de inteligencia artificial que han sido entrenados en conjuntos de datos históricos que codifican cada brecha que la industria nunca solucionó. Parte de la infraestructura está empezando a ponerse al día. El Ley de IA de la UE ahora requiere que los desarrolladores de IA revelen en qué material protegido por derechos de autor se capacitaron. En abril de 2026, Spotify lanzó una beta construido sobre DDEX, el organismo estándar de metadatos de la industria, que permite a los artistas revelar cómo se utiliza la IA en su música. De manera similar, Apple Music, Bandcamp y Deezer están haciendo cumplir las divulgaciones sobre IA a su manera. Universal Music también ha comenzado a incorporar el Identificador de nombres estándar internacional (ISNI) en su catálogo. Estas medidas abordan la transparencia y la atribución, no el desequilibrio subyacente en los datos en sí. Pero la divulgación es donde comienza la rendición de cuentas.

Estamos viendo surgir soluciones y hay avances, pero ¿se están produciendo con suficiente rapidez? La industria ha vivido con este problema de infraestructura durante décadas sin solucionarlo. La IA ha convertido la búsqueda de esta solución en una fecha límite.

Rufy Ghazi es un profesional del negocio musical con experiencia en gestión de productos, transformación digital e investigación. Trabaja como consultora de productos para empresas de tecnología musical, aprovechando su experiencia en ByteDance (TikTok), Amra (Kobalt Music Group) y varias empresas emergentes en etapa inicial. Es la jefa de investigación musical en Audience Strategies, donde encabeza proyectos de investigación basados ​​en datos. Sus informes notables incluyen el Informe de la industria de la música electrónica del Reino Unido (para la NTIA), Sound Investments (el estudio de MTUK sobre el ecosistema de tecnología musical del Reino Unido) y A Slice of Fairness (para Aslice). También ha liderado la iniciativa Fair Play, una auditoría independiente de derechos y regalías de la música electrónica.


Pase VIP de cartelera

Empezar

Give us a call or fill in the form below and we will contact you. We endeavor to answer all inquiries within 24 hours on business days.