Esta IA en tu iPhone traduce tu voz de una manera increíble
La inteligencia artificial está aprendiendo a hacer cosas que, hasta hace unos meses, parecían sacadas de la ciencia ficción. Sin embargo, estos usos ya están entre nosotros, y en el post de hoy te traemos una nueva herramienta de IA que puedes usar desde tu iPhone y que traduce tu voz. Sí, por extraño que te parezca un idioma, Gracias a este algoritmo, lo hablarás (en vídeo) como si fueras un hablante nativo.
Crea un deepfake de tu voz, pero en otro idioma
Las recreaciones de nuestra persona, en sus distintas vertientes, ya se está manifestando de diferentes formas en el mundo de la inteligencia artificial. Ya sea poniendo nuestra cara en otra persona o dando nuestra voz a los procesadores para que podamos recrearla virtualmente, esto no ha hecho más que empezar.
Y una de las iteraciones que ha salido a la luz recientemente es Rask.AI, una herramienta web que podemos abrir desde Safari, que tiene una premisa muy sencilla: nos grabamos en vídeo hablando delante de la cámara; subimos el vídeo a la aplicación web y esperamos a que se procese y, finalmente, recibiremos el mismo vídeo, con nuestra cara y nuestra voz, pero traducida al idioma que queramos. Eso sí, debemos tener que estamos hablando de una herramienta de nueva creación, en la que estamos utilizando la versión gratuita. Esto implica que los idiomas que sean más parecidos entre sí o que se traduzcan con más frecuencia tendrán un resultado mucho más acertado, en lo que a nuestra voz se refiere. Pero esto es IA, por lo que también es cuestión de poco tiempo para ver una mejora significativa en ese aspecto.
Parece difícil de creer al principio, pero la verdad es que es una herramienta que funciona sorprendentemente bien para ser de tan reciente creación. De momento, solo funciona el apartado de traducir nuestra voz. Pero no hay sincronización de labios. Es decir, que en futuras versiones, los desarrolladores ya han dicho que, además de la voz traducida, Esto estará sincronizado con la dicción y el movimiento de nuestros labios.
Cómo se traduce nuestra voz en Rask.AI
La operación es muy simple. Una vez hayamos iniciado sesión tendremos un panel en el que veremos los proyectos que hemos traducido. Todo lo que tenemos que hacer es seleccionar el video que queremos, ajustar los parámetros de idioma y dejar que la IA lo procese. ¿Y cómo lo hace? Pues transcribiendo lo que decimos en el video, para luego traducirlo y aplicarlo con la técnica del deepfake de voz.
Cuando se traduce el video, el sitio web nos dice que podemos cerrar la página. Y en unos minutos recibiremos un email con el proyecto ya traducido. Pero también podemos obtener el resultado de nuestra traducción en la propia interfaz web de Rask.AI.
Rask.AI tiene un plan gratuito con el que tenemos acceso a traducir dos videos por mes, máximo 100 mb de tamaño y un minuto de duración. Sin embargo, con el plan de pago, esta limitación está desbloqueada. Y es que tendremos hasta 25 minutos de duración máxima por vídeo, en más de 60 idiomas diferentes, en el plan de 39 dólares al mes. Pero si queremos ir más allá, podemos optar por el plan Pro, que cuesta 99 dólares al mes y con el que tendremos acceso anticipado a la función de sincronización de labios, y una duración máxima de 100 minutos por cada vídeo.