Spotify adquiere Sonantic, plataforma de voz de Inteligencia Artificial

image

Esta adquisición amplia su alcance en la tecnología de audio, lo que abre la puerta no solo a la creación de más funciones en Spotify, sino también a otros negocios potenciales y oportunidades en otros lugares también.

Sonantic, una startup con sede en Londres, ha construido un motor de Inteligencia Artificial para crear voces humanas con un sonido muy realista, pero simuladas, a partir de texto.

La empresa se fundó para crear servicios de voz realistas basados ​​en IA para entornos de juegos y entretenimiento, y su tecnología ayudó a dar vida a la voz de Val Kilmer en «Top Gun: Maverick«. En la vida real, el actor no puede hablar como lo hacía en el pasado a consecuencia de un cáncer de garganta; así que para la secuela en la que repitió su papel, su condición y la voz simulada que creó Sonantic, se escribieron en la trama de la película.

Sonantic había recaudado menos de $3 millones en fondos de un interesante grupo de inversionistas que incluía a EQT Ventures, Entrepreneur First (EF), AME Cloud Ventures, Bart Swanson de Horizons Ventures, Kevin Lin de Twitch, Jeremy Jap, Charles Jolley y más.

Tampoco está claro cuál fue el momento de la adquisición y si surgió de la puesta en marcha en busca de más recaudación de fondos, o el éxito de la exposición de la película de alto perfil, o algo completamente diferente. “Conocemos la tecnología de Sonantic desde hace un tiempo”, dijo un portavoz de Spotify.

También dijo que todo el equipo de Sonantic se sentará dentro del «Consumidor y Plataforma BU en la Misión de Personalización» dirigido por Ziad Sultan, quien es vicepresidente de personalización en Spotify. “Estamos realmente entusiasmados con el potencial de llevar la tecnología de voz de IA de Sonantic a la plataforma de Spotify y crear nuevas experiencias para nuestros usuarios”, dijo Sultan en un comunicado. “Esta integración nos permitirá involucrar a los usuarios de una manera nueva e incluso más personalizada”.

Por lo que parece, las aplicaciones más inmediatas para usar la tecnología estarán en Spotify, especialmente a medida que se expande su alcance aún más en nuevos entornos donde los consumidores no pueden sumergirse en las interacciones en pantalla, como en los vehículos, a través de servicios como Car Thing, lanzado a principios de este año.

Un ejemplo que da Spotify de cómo podría usar la tecnología es usar voces de IA para brindar más recomendaciones y descripciones basadas en audio a los usuarios que no miran sus pantallas, por ejemplo, para aquellos que conducen automóviles o escuchan mientras realizan otras actividades y incapaz de mirar una pantalla.

“Creemos que, a largo plazo, la voz de alta calidad será importante para aumentar nuestra proporción de escuchas”, señala. Lo que es interesante considerar es qué planes, si los hay, podría tener Spotify para las operaciones existentes de Sonantic, que se centran en una línea de negocios más B2B. Notamos que cuando la compañía anunció por última vez la financiación, tenía 10 asociaciones de I + D con estudios de juegos AAA, y es una presencia regular en eventos como GDC.

Dado lo mucho que la empresa ha apostado por los podcasts para complementar la música y las herramientas que está construyendo para los creadores (tanto para los que trabajan en podcasts como para los que producen y crean música), existe la posibilidad de usar lo que Sonantic ha creado para desarrollar herramientas que los creadores podrían usar, ya sea para facilitar el negocio de producir podcasts, o para pensar en tipos completamente nuevos de interacciones con sus audiencias.

Junto a eso, está la idea de que Spotify podría continuar las relaciones de Sonantic con los estudios de juegos y entretenimiento, lo que representa un nuevo frente para Spotify en la forma en que diversifica su propio negocio con más productos B2B orientados a la empresa, un área en la que Spotify no ha hecho mucho hasta la fecha

Esto podría abrir la puerta para que Spotify produzca audiolibros, material de capacitación en audio y locuciones en video a bajo costo, así como programas de noticias generados directamente de texto a voz por inteligencia artificial.