Por Shana Hazuki*
NVIDIA ha dado un paso más en la innovación de la inteligencia artificial con la presentación de Fugatto (Foundational Generative Audio Transformer Opus 1), un modelo experimental que busca posicionarse como la herramienta definitiva para la creación y manipulación de audio. Apodado por la compañía como una «navaja suiza para el sonido», Fugatto es capaz de generar y modificar audio, música y voz a partir de comandos en texto, ofreciendo aplicaciones que podrían transformar industrias enteras.
¿Qué hace a Fugatto único?
A diferencia de otras herramientas de audio impulsadas por IA, Fugatto fue diseñado para entender el sonido como lo hacen los humanos. Su capacidad para trabajar en múltiples idiomas y acentos es el resultado de una colaboración internacional entre investigadores de IA, lo que amplía su alcance y versatilidad.
Aplicaciones clave del modelo:
- Producción musical: Fugatto puede generar prototipos de canciones que los productores pueden ajustar, experimentando con estilos, voces e instrumentos.
- Educación: Creación de material didáctico personalizado, como ejercicios de aprendizaje de idiomas con voces específicas.
- Desarrollo de videojuegos: Generación de variaciones de audio adaptables en tiempo real, ajustándose a las decisiones y acciones de los jugadores.
Más allá de lo previsible
Una de las características más sorprendentes de Fugatto es su capacidad para realizar tareas no incluidas en su entrenamiento previo. Por ejemplo, puede combinar instrucciones complejas, como generar un discurso enojado con un acento específico o simular el sonido de aves cantando durante una tormenta eléctrica. Además, puede generar sonidos dinámicos que evolucionan con el tiempo, como el cambio en la intensidad de una tormenta mientras se desplaza.
¿Cuándo podremos probarlo?
Por ahora, NVIDIA no ha confirmado si Fugatto estará disponible al público, dejando su potencial impacto en manos de futuras decisiones estratégicas. Sin embargo, no es la primera herramienta de este tipo: Meta ya lanzó un kit de IA de código abierto para la creación de sonidos basados en texto, y Google cuenta con MusicLM, una IA similar accesible desde el sitio web AI Test Kitchen.
¿El futuro del sonido?
Con Fugatto, NVIDIA no solo busca innovar en la tecnología de audio, sino redefinir cómo creamos, editamos y experimentamos con el sonido. Desde la música hasta los videojuegos, pasando por la educación y el cine, este modelo podría abrir nuevas puertas para la creatividad y la personalización en múltiples sectores. ¿Estamos frente a una revolución sonora impulsada por la IA? El tiempo lo dirá.
