Google I/O 2024: IA para una nueva generación

Sundar Pichai, CEO de Google y Alphabet, compartió noticias durante Google I/O, incluidas actualizaciones en Gemini, Android, Búsqueda y Fotos.

Nota del redactor: El siguiente texto es una transcripción modificada de los comentarios de Sundar Pichai en I/O 2024, adaptada para incluir más información de lo anunciado sobre el escenario. Consulte todas las notas informativas.

Google ha entrado de lleno en la era Gemini. Antes de entrar en materia, Pichai reflexionó sobre el momento en el que se encuentran. Han estado invirtiendo en IA más de una década, innovando en todas sus facetas: investigación, productos e infraestructura. A pesar de los avances, considera que están solo al inicio del nuevo rumbo que está tomando la IA, con muchas oportunidades en el futuro para creadores, desarrolladores y nuevas empresas.

La era Gemini

Hace un año, en I/O, presentaron sus planes para Gemini, un modelo vanguardista creado para ser multimodal desde el principio, capaz de razonar a través de textos, imágenes, videos, códigos y más. Desde entonces, han presentado los primeros modelos de Gemini, los más capaces hasta el momento, con un rendimiento excepcional en pruebas comparativas multimodales. Posteriormente, lanzaron Gemini 1.5 Pro, un avance significativo en el contexto extenso, con la capacidad de ejecutar un millón de tókenes en producción de manera constante.

Más de 1500 millones de desarrolladores utilizan los modelos de Gemini en herramientas para depurar código, adquirir nuevos conocimientos y crear la nueva generación de aplicaciones de IA. Estas innovaciones se han integrado en todos los productos de Google, como Búsqueda, Fotos, Workspace, Android y otros.

Avances en el producto

Actualmente, todos los productos de Google, con 2000 millones de usuarios, emplean Gemini. Además, han creado nuevas experiencias en dispositivos móviles que permiten a los usuarios interactuar con Gemini directamente a través de la aplicación propia disponible tanto en Android como en iOS. Más de un millón de personas ya se han registrado para probar Gemini Advanced.

Una de las transformaciones más interesantes se ha producido en la Búsqueda de Google, con la experiencia «Resúmenes creados con IA» que se lanzará esta semana en EE. UU. y pronto en más países. Esta experiencia ha aumentado tanto el uso de la Búsqueda como la satisfacción de los usuarios.

Presentamos “Pregunta a Fotos”

Google Fotos, lanzado hace casi 9 años, ahora cuenta con «Pregunta a Fotos», una función que permite a los usuarios buscar en sus fotos y videos de manera más avanzada. Por ejemplo, se puede preguntar a Fotos sobre eventos específicos y recibir resúmenes detallados.

Con Preguntar a Fotos puedes buscar en tus fotos y vídeos de una forma más avanzada.

Más conocimientos con multimodalidad y contexto extenso

Gemini, al ser multimodal desde el principio, no solo comprende todos los tipos de entrada, sino que también encuentra conexiones entre ellas. El contexto extenso permite manejar grandes cantidades de información, como cientos de páginas de texto o repositorios enteros de código. Gemini 1.5 Pro, con una ventana de contexto de un millón de tókenes, ya está disponible para los usuarios de Gemini Advanced en 35 idiomas.

2 millones de tókenes en la versión preliminar privada

Google ha extendido la ventana de contexto a 2 millones de tókenes, disponible en versión preliminar privada para desarrolladores, marcando un paso más hacia el objetivo de lograr un contexto infinito.

Gemini 1.5 Pro en Workspace

Gemini 1.5 Pro ya está disponible en Workspace Labs, permitiendo a los usuarios realizar tareas complejas como resumir correos y analizar adjuntos automáticamente.

Salidas de audio en NotebookLM

Los resúmenes de audio en NotebookLM utilizan Gemini para generar conversaciones de audio personalizadas e interactivas a partir de materiales de origen.

Más avances gracias a los agentes de IA

Los agentes de IA representan una oportunidad para desarrollar sistemas inteligentes que demuestren razonamiento, planificación y memoria, capaces de realizar tareas complejas bajo la supervisión del usuario.

Lo que significa para nuestra misión

El poder de Gemini acerca a Google a su objetivo final de hacer que la IA sea útil para todos, organizando la información del mundo y haciéndola accesible a través de cualquier formato.

Infraestructura para la era de la IA: Presentamos Trillium

Para entrenar modelos de última generación, se necesita una gran capacidad de computación. Google ha anunciado su sexta generación de TPUs: Trillium, con un rendimiento computacional 4.7 veces superior a la generación anterior. A finales de 2024, Trillium estará disponible para los clientes.

El capítulo más emocionante de la Búsqueda hasta el momento

La Búsqueda de Google en la era Gemini combina infraestructura avanzada, capacidades de IA de última generación y décadas de experiencia, representando el capítulo más emocionante de la Búsqueda hasta el momento.

Experiencias de Gemini más inteligentes

Gemini ha sido diseñado para ser un asistente personal que ayude en el día a día, permitiendo realizar tareas complejas y ejecutar acciones. La nueva experiencia llamada “Live” permite tener conversaciones profundas con Gemini usando solo la voz. Además, se extenderá la ventana de contexto a 2 millones de tókenes en Gemini Advanced a finales de año, permitiendo cargar y analizar archivos superdensos.

Gemini en Android

Con miles de millones de usuarios de Android en todo el mundo, Google integrará una experiencia más profunda de Gemini en el sistema operativo, permitiendo un procesamiento multimodal de texto, imágenes, audio y voz, manteniendo la información privada en el dispositivo.

Enfoque responsable en el uso de la IA

Google se asegura de abordar la IA de manera responsable. Han desarrollado una técnica de «red teaming asistido por IA» y han introducido técnicas innovadoras de marca de agua, como SynthID, para facilitar la identificación del contenido generado por IA.

Creando el futuro juntos

El progreso de Google en IA solo es posible gracias a su comunidad de desarrolladores. Con infraestructuras de vanguardia, productos a escala masiva y plataformas que permiten la innovación, Google invita a todos a crear juntos las oportunidades del futuro.