
Nvidia anunció el lanzamiento de “Fugatto” (“Foundational Generative Audio Transformer Opus 1” por sus siglas en inglés) un nuevo modelo de inteligencia artificial para la creación de música, sonidos y la combinación de voces mediante un software. Tiene la capacidad de transformar la escena musical con el ingreso de esta tecnología.
La función de Fugatto es sumamente sencilla ya que permite crear composiciones únicas utilizando entradas de audio y texto, incluso si el modelo nunca había sido utilizado previamente. Algo totalmente novedoso para esta área. También es capaz de detectar y analizar audios que carguen los usuarios y aislar voces o sonidos, para luego continuar con su edición.
A diferencia de otras herramientas para crear música, Fugatto tiene la capacidad de captar y modificar un audio existente y transformarla en una voz cantada por un ser humano. Incluso puede cambiar su tono de voz por un estado de ánimo o simplemente cambiarle el acento.
“Si pensamos en el audio sintético de los últimos 50 años, la música suena diferente ahora gracias a los sintetizadores. Creo que la IA generativa va a aportar nuevas capacidades a la música, a los videojuegos y a la gente corriente que quiere crear cosas“, sostuvo Bryan Catanzaro, vicepresidente de investigación aplicada de aprendizaje profundo en Nvidia.
A pesar de la revolución que se generó con esta noticia, la compañía yankee aún no anunció la fecha de estreno de esta nueva herramienta.
Fugatto, una novedad con IA para los artistas
Al momento de crear música, los cantantes suelen utilizar distintos aparatos capaces de combinar voces con instrumentos musicales en distintas grabaciones, pero la diferencia de Fugatto es que puede cumplir con estas funciones de manera simultánea cambiando el tono de voz y los acentos.
Para generar esa flexibilidad genera sonidos que pueden cambiar con el tiempo, denominado ‘interpolación temporal’. De esta manera, es capaz de crear los sonidos de, por ejemplo, una tormenta se desplaza por una zona concreta con ‘crescendos’ de truenos que se desvanecen en la distancia.
Además, es capaz de crear paisajes sonoros que acompañen el contexto, como por ejemplo, de una tormenta eléctrica al amanecer con el canto de pájaros.
Además de la música o videojuegos, Fugatto se podrá utilizar en otras áreas
Esta nueva herramienta de inteligencia artificial se puede utilizar por ejemplo, en campañas de marketing, ya que puede crear voces en distintos idiomas y contextos sociales.
Asimismo, Fugatto también puede ser utilizado en los videojuegos. Los desarrolladores podrán utilizarlo para modificar los títulos y que se puedan adaptar a la acción de éste a medida que transcurren las partidas, entre otros casos de uso.
¿Cuál es el riesgo de Fugatto?
A pesar de que puede ser útil en muchos aspectos, la compañía señaló que cualquier tecnología generativa implica riesgos, ya que las personas pueden utilizarla para crear o producir cosas que sería preferible que no se creara.
Por esta razón, Nvidia aún no ha anunciado la fecha de lanzamiento de esta nueva tecnología. Una postura similar adotaron OpenAI y Meta sobre sus propias herramientas.