La nueva IA de Microsoft hace rapear a Mona Lisa. ¿Como funciona?

La nueva IA de Microsoft hace rapear a Mona Lisa.  ¿Como funciona?

(CNN)– La Mona Lisa puede hacer más que sonreír gracias a la nueva tecnología de inteligencia artificial de Microsoft.

La semana pasada, investigadores de Microsoft dieron a conocer un nuevo modelo de inteligencia artificial que puede tomar una imagen fija de un rostro y un clip de audio de alguien hablando y crear automáticamente un video realista de esa persona hablando. Los vídeos, que pueden estar hechos a partir de caras, dibujos animados o ilustraciones fotorrealistas, se completan con una sincronización de labios convincente y movimientos naturales de la cara y la cabeza.

En un vídeo de demostración, los investigadores mostraron cómo animaron a Mona Lisa para que recitara un rap cómico de la actriz Anne Hathaway.

Los resultados del modelo de IA, llamado VASA-1, son tan divertidos como un poco impactantes por su realismo. Según Microsoft, esta tecnología podría usarse en educación o para «mejorar la accesibilidad de personas con problemas de comunicación», o incluso para crear compañeros virtuales para humanos. Pero también es fácil ver cómo se podría abusar de la herramienta y utilizarla para hacerse pasar por personas reales.

Es una preocupación que va más allá de Microsoft: a medida que surgen más herramientas para crear imágenes, vídeos y audio atractivos generados por IA, Los expertos están preocupados. que su mal uso puede dar lugar a nuevas formas de desinformación. A algunos también les preocupa que la tecnología pueda perturbar aún más las industrias creativas, desde el cine hasta la publicidad.

Por el momento, Microsoft no tiene previsto hacer público el modelo VASA-1 de forma inmediata. La medida es similar a la forma en que el socio de Microsoft, OpenAI, está gestionando Preocupaciones en torno a su herramienta de vídeo generada por IA, Sora. OpenAI presentó Sora en febrero, pero hasta ahora sólo lo ha puesto a disposición de unos pocos usuarios profesionales y educadores en ciberseguridad con fines de prueba.

READ  ¿Por qué no debes dejar encendido el Bluetooth en tu teléfono?

«Nos oponemos a cualquier comportamiento que cree contenido engañoso o dañino de personas reales», dijeron investigadores de Microsoft en una publicación de blog. Pero, agregaron, la compañía «no tiene planes de lanzar» el producto públicamente «hasta que estemos seguros de que la tecnología se utilizará de manera responsable y de acuerdo con las regulaciones apropiadas».

las caras se mueven

El nuevo modelo de inteligencia artificial de Microsoft se entrenó en numerosos videos de rostros de personas hablando y está diseñado para reconocer los movimientos naturales de la cara y la cabeza, incluido «el movimiento de los labios, la expresión (sin labios), la mirada y el parpadeo, entre otros», explicaron los investigadores. . El resultado es un vídeo más realista cuando VASA-1 anima una fotografía.

Por ejemplo, en un vídeo de demostración con un clip de alguien que parece agitado, aparentemente mientras juega videojuegos, la cara que habla tiene las cejas fruncidas y los labios fruncidos.

La herramienta de IA también puede producir un vídeo en el que el sujeto mira en una dirección determinada o expresa una emoción específica.

Si miras de cerca, todavía hay signos de que los videos han sido generados por una máquina, como parpadeos poco frecuentes y movimientos exagerados de las cejas. Pero Microsoft cree que su modelo «supera con creces» a otras herramientas similares y «allana el camino para la interacción en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *