VALL-E, la inteligencia artificial que imita voces con muestras de 3 segundos

Investigadores de la empresa Microsoft dieron a conocer un sistema de inteligencia artificial (IA) capaz de imitar voces con un alto grado de realismo. La tecnología que presentaron, denominada VALL-E, consigue sus resultados con muestras de sólo 3 segundos de duración.

Investigadores de la empresa Microsoft dieron a conocer un sistema de inteligencia artificial (IA) capaz de imitar voces con un alto grado de realismo. La tecnología que presentaron, denominada VALL-E, consigue sus resultados con muestras de sólo 3 segundos de duración.

VALL-E: cómo funciona la inteligencia artificial que imita voces

En los últimos años, el exponencial crecimiento de los sistemas de IA, que día a día consiguen más habilidades, fue mas notorio. Desde falsificaciones profundas de imágenes y videos, hasta la generación de textos en forma automática. ChatGPT, un avance creado por OpenAI, ha ocupado el centro de la escena durante las últimas semanas por sus asombrosas capacidades.

2EYXOIP25BGEZAMJA2XRKCW6Y4.jpg

El campo de acción de VALL-E se acota a las voces. Su virtud es imitar tonos de voz partiendo de datos de entrada que no necesariamente deben ser extensos.

Siguiendo el repaso de Gizmodo, Microsoft se basó en EnCodec, una tecnología de compresión de audio de Meta que usa IA para operar con sonidos con mejor calidad que un CD, sin pérdidas de calidad.

dia o noche