Nvidia presenta un modelo de IA para la generación de música y audio
- Por Dorianns Jaimes
- 28 de noviembre de 2024
Nvidia ha lanzado Fugatto, un nuevo modelo de inteligencia artificial diseñado para generar y modificar música, voces y sonidos. La empresa explicó el lunes que este enfoque está dirigido a profesionales en producción musical, cinematografía y creación de videojuegos.
El modelo, denominado oficialmente Fundational Generative Audio Transformer Opus (Fugatto, por sus siglas en inglés), permite a los usuarios generar o modificar audio utilizando pistas proporcionadas en texto o fuentes de audio. Según Nvidia, el modelo puede crear sonidos completamente nuevos, cambiar instrumentos en una canción, traducir descripciones escritas en fragmentos musicales e incluso modificar acentos o emociones en un discurso.
Rafael Valle, gerente de investigación aplicada de audio en Nvidia, comentó: “Queríamos crear un modelo que entendiera y generara sonido como lo hacen los humanos.”
Aplicaciones prácticas
Fugatto tiene aplicaciones útiles en diversas áreas. Por ejemplo, las agencias de publicidad podrían editar locuciones con diferentes acentos o emociones para adaptarse a campañas en distintas regiones. En la creación de videojuegos, el modelo permite cambiar dinámicamente los elementos de audio en tiempo real según las actividades dentro del juego.
Nvidia destacó la capacidad del modelo para realizar transformaciones sonoras inusuales, como hacer que una trompeta suene como un perro ladrando o que un saxofón imite el maullido de un gato. Además, Fugatto puede generar voces cantadas de alta calidad a partir de texto, incluso con datos mínimos de entrenamiento, a pesar de no estar diseñado específicamente para estas tareas.
Potencia técnica
Fugatto está impulsado por 2.500 millones de parámetros y se desarrolló utilizando los sistemas DGX de Nvidia, equipados con 32 GPUs H100 Tensor Core. La compañía señaló que el desarrollo del modelo tomó más de un año de trabajo.
Por ahora, Nvidia no ha anunciado cuándo Fugatto estará disponible para uso público o comercial.
Newsletter
Los más populares
Por qué Taylor Swift representa un antes y un después en la industria musical
- 30 de noviembre de 2021
Bad Bunny hace historia en los Premios Grammy 2022
- 17 de noviembre de 2022
El CEO de Spotify deberá testificar en demanda introducida por Eminem
- 20 de julio de 2022