OpenAi presenta una IA generativa que puede dialogar

Un selecto grupo de usuarios de ChatGPT Plus ha comenzado a probar la versión alfa del nuevo modo de voz de la inteligencia artificial generativa de OpenAI. Según la información compartida en redes sociales como X y LinkedIn, esta nueva función permitirá una comunicación en lenguaje natural en tiempo real, con la posibilidad de interrumpir la locución en cualquier momento. El sistema también tendrá la capacidad de detectar y responder a las emociones de los interlocutores.

Como ocurre con muchas innovaciones, OpenAI planea una implementación gradual en las próximas semanas, con el objetivo de que todos los usuarios de ChatGPT Plus puedan acceder a esta función durante el otoño. Los usuarios seleccionados para la fase alfa recibirán una notificación en la aplicación de ChatGPT y un correo electrónico con las instrucciones para usar la nueva función. Sin embargo, la opción de compartir video y pantalla aún no estará disponible en esta versión.

En línea con sus prioridades estratégicas, OpenAI se centrará en mantener altos estándares de calidad y seguridad en las conversaciones. En términos de calidad, el modelo se ha optimizado para manejar millones de conversaciones de voz simultáneas con baja latencia y alta calidad. En cuanto a la seguridad, la compañía ha estado trabajando para mejorar la detección y rechazo de contenidos inapropiados, realizando pruebas con más de 100 miembros externos que hablan 45 idiomas diferentes y provienen de 29 regiones geográficas.

Para proteger la privacidad de los usuarios, el nuevo modo de voz utilizará cuatro voces preestablecidas, desarrolladas en colaboración con actores de doblaje. De esta manera, ChatGPT no podrá imitar voces de personas reales, ya sean particulares o figuras públicas, y se bloquearán intentos de salida que no correspondan a estas voces predefinidas.

Además, se han implementado nuevos filtros para prevenir la generación de música u otros audios protegidos por derechos de autor. OpenAI asegura que las medidas de seguridad aplicadas en el modo de voz son equivalentes a las de la modalidad de texto, garantizando el cumplimiento de la legislación vigente y evitando la creación de contenido perjudicial. A lo largo de agosto, la compañía publicará un informe detallado sobre los esfuerzos para optimizar la seguridad y mejorar la experiencia del nuevo modo de voz.

OpenAI enfatiza que esta fase alfa tiene como objetivo probar, aprender y perfeccionar el sistema, permitiendo ajustes y mejoras basadas en los comentarios de los usuarios reales.