Modelo de IA de Meta puede tomar acordes o ritmos y convertirlos en canciones
Meta sigue avanzando en el campo de la inteligencia artificial (IA). Su última innovación, JASCO, ha sido presentada por la división de investigación de IA de la compañía, conocida como el equipo de Investigación Fundamental de IA (FAIR). Esta herramienta promete revolucionar la forma en que se crea música con inteligencia artificial, proporcionando a los creadores un control sin precedentes sobre el resultado musical.
JASCO, cuyo nombre completo es «Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation» (Condicionamiento Conjunto de Audio y Símbolos para Generación de Música a partir de Texto Controlada Temporalmente), puede transformar acordes o ritmos en pistas musicales completas. Según Meta, JASCO permite un control significativamente mejor y más versátil sobre la música generada, en comparación con otras herramientas de IA disponibles en el mercado.
Para demostrar las capacidades de JASCO, Meta ha publicado una serie de clips musicales en su blog. En estos ejemplos, melodías de dominio público se convierten en pistas de diversos géneros. Por ejemplo, el Bolero de Maurice Ravel es transformado en una canción pop de los años 80 y una canción folclórica con acordeón y guitarra acústica. De manera similar, El Lago de los Cisnes de Tchaikovsky se reinterpreta como una pista tradicional china con guzheng, percusión y flauta de bambú, y también como una pista de R&B con bajo profundo, batería electrónica y trompeta principal.
Meta ha mostrado un compromiso continuo con la apertura y colaboración en el ámbito de la inteligencia artificial. En línea con esta filosofía, ha publicado un artículo de investigación detallando el desarrollo de JASCO y planea lanzar el código de inferencia bajo una licencia MIT, además del modelo preentrenado bajo una licencia Creative Commons. Esta apertura permitirá a otros desarrolladores de IA utilizar y mejorar el modelo para crear sus propias herramientas de música con IA.
La llegada de JASCO sigue a otro hito significativo de Meta en el ámbito de la música generada por IA. Hace un año, la empresa lanzó MusicGen, una herramienta capaz de crear pistas de 12 segundos a partir de indicaciones de texto simples. MusicGen fue entrenado con 20,000 horas de música licenciada por Meta y 390,000 pistas solo de instrumentos de Shutterstock y Pond5. Esta herramienta también permite el uso de melodías como entrada, convirtiéndola en una de las primeras en transformar una melodía en una canción completa.
La presentación de JASCO se produce en un momento de gran actividad en el campo de la música generada por IA. El mismo día, DeepMind, el laboratorio de IA de Google, reveló una nueva herramienta de video a audio (V2A) que puede crear bandas sonoras para videos basándose en indicaciones de texto o en el contenido visual del video. Además, Stability AI lanzó Stable Audio Open, un modelo de código abierto para crear clips de audio de hasta 47 segundos, permitiendo a los usuarios ajustar el producto con sus propios datos de audio.
Estas innovaciones destacan el rápido avance y la competencia en el campo de la música generada por IA. Sin embargo, también han surgido preocupaciones en la industria musical sobre el uso de música con derechos de autor para entrenar estas herramientas sin autorización. Empresas como Udio y Suno, que crean pistas enteras a partir de indicaciones de texto, ya han sido demandadas oficialmente por las compañías discográficas más importantes en los EEUU, representadas por la RIAA.