Creación de imágenes con ChatGPT 

En este post hablaremos de cómo navegar por la nueva función de creación de imágenes de ChatGPT, desde cómo usarla de manera efectiva hasta comprender sus limitaciones

¿Qué son las entradas de imágenes y cómo funcionan en ChatGPT?

ChatGPT ahora cuenta con capacidades de imágenes para comprender e interpretar las imágenes que se agregan a las conversaciones como entradas de imágenes.

¿Cómo debo utilizar entradas de imágenes en las conversaciones?

  • Uso básico: sube una foto para comenzar. Pregunta sobre objetos en imágenes, analiza documentos o explora contenido visual. Agrega más imágenes en posteriores mensajes para profundizar o cambiar la conversación. Vuelve en cualquier momento con nuevas fotos.
  • Anotar imágenes: para destacar áreas específicas, considera utilizar una herramienta de edición de fotos en tu imagen antes de cargarla. Esto guiará a ChatGPT para que se enfoque en los elementos que consideres importantes.

¿Qué planes pueden utilizar entradas de imágenes?

Plus y ChatGPT Enterprise.

¿Qué modelos pueden aceptar entradas de imágenes?

GPT-4.

¿En qué plataformas están disponibles las entradas de imágenes?

Todas las plataformas, incluida la web (chat.openai.com) y móvil (iOS/Android).

¿Se utilizan mis imágenes para mejorar los modelos?

El enfoque de Open AI en el uso del contenido, incluidas las imágenes, sigue siendo el mismo para cada producto.

Consulta Cómo se utilizan sus datos para mejorar el rendimiento del modelo para comprender mejor cómo se puede utilizar el contenido de ChatGPT para mejorar el rendimiento del modelo y las opciones que tienen los usuarios.

Para ChatGPT Enterprise, no se utiliza contenido para entrenar los modelos.

¿Cómo agrego entradas de imágenes en ChatGPT?

Asegúrate de que el selector de modelo esté configurado en GPT-4 y luego toca el ícono + en el área de solicitud para agregar entradas de imágenes.

¿Las entradas de imágenes admiten vídeos?

No, no pueden soportar vídeos. Actualmente solo admiten el procesamiento de imágenes estáticas.

¿Qué tipos de archivos son compatibles?

PNG (.png), JPEG (.jpeg y .jpg) y GIF no animado (.gif).

¿Cuántas imágenes puedo subir a la vez?

La cantidad de imágenes que puedes agregar a una conversación depende de varios factores, incluido el tamaño de las imágenes y la cantidad de texto que las acompaña. Como pauta general, si tienes problemas, considera reducir la cantidad o el tamaño de las imágenes.

¿Cuál es el límite de tamaño por imagen?

20 MB.

¿Cómo manejan las capacidades de imagen las imágenes ambiguas o poco claras?

Si una imagen es ambigua o poco clara, el modelo hará todo lo posible para interpretarla. Sin embargo, los resultados pueden ser menos precisos.

¿Qué limitaciones deben tener en cuenta los usuarios al utilizar ChatGPT con entradas de imágenes?

Si estás utilizando la nueva función de entrada de imágenes de ChatGPT, es importante tener en cuenta estas limitaciones:

  • Médico: el modelo no es adecuado para interpretar imágenes médicas especializadas como tomografías computarizadas y no debe usarse para asesoramiento médico.
  • No inglés: el modelo no funciona tan bien al manejar imágenes con texto de alfabetos no latinos, como el japonés o el coreano.
  • Texto grande: amplía el texto dentro de la imagen para mejorar la legibilidad, pero evita recortar detalles importantes.
  • Rotación: el modelo puede malinterpretar el texto o las imágenes giradas o al revés.
  • Elementos visuales: el modelo puede tener dificultades para comprender gráficos o texto donde varían los colores o estilos, como líneas continuas, discontinuas o de puntos.
  • Espacial: el modelo tiene dificultades con tareas que requieren una localización espacial precisa, como identificar posiciones de ajedrez.
  • Precisión: el modelo puede generar descripciones o leyendas incorrectas en ciertos escenarios.
  • Forma: El modelo tiene dificultades con las imágenes panorámicas y de ojo de pez.
  • Metadatos y cambio de tamaño: el modelo no procesa nombres de archivos ni metadatos originales, y las imágenes cambian de tamaño antes del análisis, lo que afecta sus dimensiones originales.
  • Conteo: puede dar recuentos aproximados de objetos en imágenes.

Fuente: Open AI