Los nuevos teléfonos móviles de Google ponen la investigación avanzada en visión por computadora y audio al alcance de los consumidores.
- Novedad: La división Alphabet presentó sus teléfonos móviles insignia Pixel 8 y Pixel 8 Pro en su evento anual de lanzamiento de hardware. Ambos dispositivos cuentan con herramientas impulsadas por IA para la edición de fotos y videos.
- Cómo funcionan: Los nuevos teléfonos de Google procesan imágenes de maneras distintivas impulsadas por algoritmos en el propio dispositivo. Establecen un nuevo estándar para Apple, el líder en smartphones, para convertir sus proyectos internos en oportunidades de mercado.
La función llamada Best Take permite a los usuarios seleccionar elementos de múltiples fotos y unirlos en una sola imagen. En una foto grupal, los usuarios pueden reemplazar caras con los ojos cerrados o gestos incómodos por alternativas de otras tomas que muestren ojos abiertos y sonrisas amplias.
Magic Editor utiliza tecnología de generación de imágenes para editar o alterar imágenes. Los usuarios pueden mover y cambiar el tamaño de elementos individuales y cambiar fondos preestablecidos. También pueden generar partes fuera del encuadre de un elemento, o incluso una foto completa, sobre la marcha.
Audio Magic Eraser divide el audio de un video en sonidos distintos, lo que permite a los usuarios ajustar su volumen relativo. Esta capacidad puede ser útil para reducir ruidos molestos o aumentar el diálogo.

Video Boost, que llegará más tarde este año solo al Pixel 8 Pro, mejorará la calidad de imagen de los videos estabilizando automáticamente el movimiento y ajustando el color, la iluminación y el grano.
- Detrás de la noticia: Los investigadores de Google han estado desarrollando activamente sistemas de IA que alteran o mejoran imágenes, videos y audio.
Best Take y Magic Editor se asemejan a un sistema que Google y los investigadores de Georgia Tech describieron en un artículo de agosto de 2023, que utiliza modelos de difusión para segmentar y fusionar múltiples imágenes.
Magic Editor recuerda a Imagen, el generador de texto a imagen de difusión de Google.
Audio Magic Eraser se asemeja a las capacidades descritas en un artículo reciente que propone AudioScopeV2 para separar y volver a combinar varias pistas de audio y video.
- Por qué es importante: Los teléfonos inteligentes producen la mayoría de las fotos y videos del mundo. Sin embargo, las herramientas generativas para editarlos se han limitado a las computadoras de escritorio, a pesar de los filtros de fotos en las redes sociales. Los nuevos teléfonos de Google acercan al mundo a la paridad entre las capacidades de los editores de imágenes de escritorio y los dispositivos portátiles. Y las capacidades de edición de audio elevan el estándar en todos los aspectos.
A principios de este año, Google acordó cumplir con compromisos voluntarios sobre la IA, incluido el desarrollo de mecanismos sólidos, como marcas de agua, que identificarían los medios generados. ¿Aplicará Google tal marca a las imágenes editadas por los usuarios de Pixel?