Stability AI lanza un generador de sonidos

image

Stability AI, la startup detrás del generador de arte impulsado por IA Stable Diffusion, ha lanzado un modelo de IA para generar sonidos y canciones que, según afirma, fue entrenado exclusivamente con grabaciones libres de regalías.

Llamado Stable Audio Open, el modelo generativo toma una descripción de texto (por ejemplo, “Ritmo de rock tocado en un estudio tratado, tocando batería en un kit acústico”) y produce una grabación de hasta 47 segundos de duración. El modelo fue entrenado utilizando aproximadamente 486,000 muestras de bibliotecas musicales libres Freesound y Free Music Archive.

Stability AI dice que el modelo puede utilizarse para crear ritmos de batería, riffs de instrumentos, sonidos ambientales y “elementos de producción” para videos, películas y programas de televisión, así como para “editar” canciones existentes o aplicar el estilo de una canción (por ejemplo, jazz suave) a otra.

“Una ventaja clave de este lanzamiento de código abierto es que los usuarios pueden ajustar el modelo en su propia base de datos de audio personalizada”, escribió Stability AI en una publicación en su blog corporativo. “Por ejemplo, un baterista podría ajustar el modelo con muestras de sus propias grabaciones de batería para generar nuevos ritmos.”

Sin embargo, Stable Audio Open tiene limitaciones. No puede producir canciones completas, melodías ni voces, al menos no de buena calidad. Stability AI dice que no está optimizado para esto y sugiere que los usuarios interesados en esas capacidades opten por el servicio premium Stable Audio de la empresa.

Stable Audio Open tampoco puede usarse con fines comerciales; sus términos de servicio lo prohíben. Tampoco rinde igual en todos los estilos musicales y culturas o con descripciones en idiomas distintos al inglés, un sesgo que Stability AI atribuye a los datos de entrenamiento.

A medida que los generadores de música, incluyendo el de Stability, ganan popularidad, el tema del derecho de autor y las formas en que algunos generadores podrían estar abusando de él se están convirtiendo en puntos focales importantes.

En mayo, Sony Music, que representa artistas como Billy Joel, Doja Cat y Lil Nas X, envió una carta a 700 empresas de IA advirtiendo contra el “uso no autorizado” de su contenido para entrenar generadores de audio. Y en marzo, la primera ley de los Estados Unidos dirigida a limitar los abusos de la IA en la música fue firmada en Tennessee.