OpenAI presenta el nuevo ChatGPT que escucha, mira y habla

Chatbots, generadores de imágenes y asistentes de voz se están fusionando poco a poco en una única tecnología con voz conversacional.

En un movimiento pionero hacia la integración tecnológica, las principales compañías de tecnología están fusionando asistentes de voz y chatbots en una sola plataforma conversacional. Tanto Apple como Google están evolucionando sus productos para ofrecer asistentes más conversacionales, mientras que OpenAI está ampliando las capacidades de su chatbot para incorporar funciones de asistente de voz.

Este pasado lunes, la innovadora empresa de San Francisco, OpenAI, lanzó una actualización de su popular ChatGPT. Esta nueva versión, basada en el avanzado modelo de inteligencia artificial GPT-4o, puede procesar y responder a entradas de voz, imágenes y vídeos con una velocidad superior a sus predecesores. Esta herramienta estará disponible gratuitamente para dispositivos móviles y ordenadores de escritorio a partir de la próxima semana.

Mira Murati, CTO de OpenAI, destacó durante un evento online la importancia de esta evolución: «Estamos mirando al futuro de la interacción entre humanos y máquinas». La aplicación no solo responde a comandos de voz, sino que también puede analizar contenido visual y auditivo en tiempo real.

A diferencia de su versión anterior, que era un ensamble de múltiples tecnologías para manejar voz y texto, la nueva aplicación de ChatGPT integra todas estas capacidades en un solo sistema. Esto elimina la latencia que antes se experimentaba y ofrece una interacción más fluida y natural.

Aunque el nuevo sistema aún no puede generar vídeos, sí tiene la capacidad de crear imágenes estáticas que simulan fotogramas de vídeo. Esto marca un paso significativo en la evolución de los chatbots hacia «agentes de IA» capaces de manejar tareas más complejas, como programar reuniones o hacer reservas, de forma fiable y eficiente.

Este desarrollo también plantea desafíos, especialmente relacionados con los errores que los sistemas pueden cometer al aprender de datos de Internet, un fenómeno conocido como «alucinación» en IA. Sin embargo, la tecnología sigue recibiendo elogios por su potencial para transformar la interacción con las máquinas y posiblemente ofrecer una alternativa viable a los motores de búsqueda tradicionales y asistentes de voz.

Con la introducción de esta tecnología unificada, OpenAI no solo mejora la eficiencia y accesibilidad de su oferta, sino que también se posiciona en la vanguardia de la innovación en inteligencia artificial.