Los nuevos asistentes de voz con IA con los que no sabrás si hablas con un humano o con una máquina
ChatGPT ha lanzado su IA de voz avanzada, que permite mantener conversaciones casi en tiempo real
Este asistente es capaz de identificar nuestras emociones y responder en consecuencia
Se puede usar para ensayar entrevistas de trabajo, repasar de viva voz antes de un examen o aprender nuevos idiomas
Todos hemos interactuado alguna vez con un asistente de voz telefónico para hacer gestiones con atención al cliente. Estos sistemas, que en un inicio eran mucho más rudimentarios, provocaban cierta ira en el interlocutor, que acababa gritándole al teléfono hasta que le pasaban con un teleoperador humano. La IA generativa está avanzando cada vez más, y esta situación podría pasar a la historia muy pronto.
En Estados Unidos ya hace unas semanas que pueden probar el nuevo asistente de voz avanzado de ChatGPT, que ya ha llegado oficialmente a Europa. Esta nueva IA es capaz de mantener una conversación coherente con un humano casi en tiempo real. Esto abre un abanico de posibilidades, no sólo para uso particular, sino también para los desarrolladores de aplicaciones y las empresas.
MÁS
De entrada, este nuevo asistente cuenta con el modelo GPT-4o, entrenado para responder a dudas de cultura general, historia, ciencia, tecnología, geografía… Además, es capaz de resolver problemas matemáticos, de programación y traducir entre diferentes idiomas. Eso sí, al tratarse de un modelo de lenguaje, hay que tener en cuenta que, pese a que las respuestas sean coherentes gramaticalmente, es mejor contrastar la información que proporciona.
¿Qué cambia con el nuevo modelo?
Hasta ahora, los asistentes de voz funcionaban con dos modelos: uno que convertía la voz en texto, y otro que procesaba el texto. Este sistema lo que permite es procesar directamente la voz y generar la respuesta, sin necesidad de convertir el audio a texto en ningún momento.
Casos de uso
“Junto con el hecho de poder interactuar con voz hay otras funciones o capacidades de esta tecnología, como es identificar estados de ánimo y poder entender la pronunciación, que lo que hacen es desbloquear capacidades, por ejemplo, a la hora de enseñar idiomas”, explica Xavier Mitjana, divulgador experto en IA generativa.
Además de aprender idiomas, también se puede usar como intérprete o para simular conversaciones. Se le puede pedir al asistente que te evalúe (preguntándole sobre un tema que te has estudiado), o que se ponga en el papel de un reclutador para ensayar una entrevista de trabajo.
Junto con el hecho de poder interactuar con voz hay otras funciones o capacidades de esta tecnología, como es identificar estados de ánimo y poder entender la pronunciación, que lo que hacen es desbloquear capacidades
Algunos de los usos sorprendentes son que se le puede pedir que susurre, que cambie de acento (podría hablar en andaluz) y también es capaz de simular situaciones de manera muy realista, como por ejemplo pidiéndole que actúe de locutor de radio o que explique un cuento infantil.
Las posibilidades de integración también son casi infinitas, puesto que la compañía tecnológica ha puesto este modelo al servicio de los desarrolladores de software (que pueden usarlo en sus servicios). No sería extraño que los asistentes telefónicos virtuales mejoraran su capacidad de atención al cliente en los próximos meses.
Limitaciones actuales
Desde la tecnológica han decidido limitar las posibilidades de este sistema para evitar problemas legales y usos poco éticos. De entrada, le han prohibido cantar (para no infringir el copyright) y tampoco podrá imitar voces (así se evita su uso en delitos de suplantación de identidad). OpenAI ha decidido también que no se conecte a internet, por lo que solo se le puede preguntar por lo que ha sido entrenado previamente, y no responderá a preguntas de actualidad.
Suscríbete a las newsletters de Informativos Telecinco y te contamos las noticias en tu mail.
Síguenos en nuestro canal de WhatsApp y conoce toda la actualidad al momento.