El fabricante de chatGPT OpenAI comunicó el martes que retrasaba un mes, hasta julio, el lanzamiento de su función "Modo Voz" debido a problemas técnicos.

La empresa había planeado originalmente desplegar la experiencia de conversación de voz realista a un pequeño grupo de usuarios de ChatGPT Plus a finales de junio, pero dijo que lo retrasaba porque necesitaba tiempo para alcanzar su estándar de lanzamiento.

"Por ejemplo, estamos mejorando la capacidad del modelo para detectar y rechazar determinados contenidos. También estamos trabajando en la mejora de la experiencia del usuario y en la preparación de nuestra infraestructura para escalar a millones, manteniendo al mismo tiempo las respuestas en tiempo real", dijo OpenAI en un post en la plataforma de medios sociales X.

La función se lanzará inicialmente a un pequeño grupo de usuarios para recabar comentarios y se pondrá a disposición de todos los usuarios de Plus en otoño, sujeta a comprobaciones de seguridad y fiabilidad, según la empresa.

OpenAI también está trabajando en el despliegue de nuevas funciones de vídeo y de pantalla compartida.

En mayo, dijo que lanzaría un nuevo modelo de IA llamado GPT-4o, capaz de mantener conversaciones de voz realistas y de interactuar a través de texto e imagen, su último movimiento para mantenerse a la cabeza en la carrera por dominar la tecnología emergente de IA.

Las nuevas capacidades de audio permitirán a los usuarios hablar con ChatGPT y obtener respuestas en tiempo real sin demora, así como interrumpir a ChatGPT mientras habla, dos características distintivas de las conversaciones realistas que los asistentes de voz de IA han considerado un reto. (Reportaje de Juby Babu en Ciudad de México; Edición de Pooja Desai)