Prepárese para escuchar lo que piensa la IA. ChatGPT está obteniendo capacidades de reconocimiento de voz e imagen además de su propia voz, pero tendrás que pagar para escucharla. Como conocemos a los chatbots, la conversación generalmente se genera a través de mensajes de texto, no de consultas audibles. Servicios como Bard, ChatGPT y Bing Chat siguen estos modelos, y recién ahora estábamos empezando a considerar todo esto normal.
ChatGPT está eliminando eso con una nueva actualización que trae una voz audible al modelo de lenguaje avanzado. Con eso, puede leer en voz alta sus respuestas con una voz tremendamente natural que rivaliza con cualquier otro asistente virtual disponible actualmente. Por su parte, puede usar su voz humana para hacer preguntas y entablar una conversación como lo hacía antes con el texto.
En esencia, ChatGPT ahora es un asistente virtual que suena natural y que puede leer tus cuentos antes de dormir y responder con todas las cosas desquiciadas que hacía antes, pero en un tono tranquilizador. OpenAI publicó un video de una interacción de demostración y es increíble verlo en acción. La voz de ChatGPT es natural y tranquila, acercándose a ese límite donde el habla virtual se vuelve indistinguible de la emitida por las cuerdas vocales. OpenAI señala que esto se logra a través de actores de voz, aunque todavía requiere mucho esfuerzo producir estas voces sintéticas a partir de audio de muestra.
Además de la voz, podrás tomar y cargar fotos y hacer preguntas, algo así como funciona Google Lens. No sólo reconoce el sujeto de la foto (puedes rodear elementos para centrar su atención) sino que también te permitirá tomar fotos adicionales para proporcionar contexto.
Fuente: 9 to 5 Google
Para leer más ingresa a: https://9to5google.com/2023/09/25/chatgpt-has-gone-full-virtual-assistant-with-voice-and-image-recognition/