Nuevos modelos anunciados en DevDay

OpenAI ha dado a conocer una serie de emocionantes novedades en su evento DevDay, incluyendo el lanzamiento de GPT-4 Turbo y una variedad de herramientas de desarrollo de vanguardia.

Actualizaciones de llamadas a funciones

OpenAI ha revelado mejoras en la función de llamadas a funciones, que permite a los usuarios describir acciones de sus aplicaciones o APIs externas a los modelos de inteligencia artificial. Estas mejoras destacan por la posibilidad de realizar múltiples llamadas a funciones en un solo mensaje, lo que agiliza la interacción con los modelos, como GPT-4 Turbo. Además, se ha mejorado la precisión de las llamadas a funciones, lo que significa que GPT-4 Turbo es más propenso a proporcionar los parámetros de función correctos, brindando una experiencia más efectiva a los desarrolladores.

GPT-3.5 Turbo actualizado

Además de GPT-4 Turbo, están lanzando una versión mejorada de GPT-3.5 Turbo. Esta nueva versión funciona aún mejor y puede entender lo que le pides de una manera más precisa. También es capaz de generar información en un formato especial llamado JSON, que es muy útil para algunos trabajos. Por ejemplo, cuando necesita crear documentos con formatos específicos, como XML o YAML.

Los desarrolladores pueden usar esta nueva versión llamándola gpt-3.5-turbo-1106 en sus aplicaciones. Si ya usan la versión anterior llamada gpt-3.5-turbo, automáticamente se actualizará a esta nueva versión el 11 de diciembre. Además, podrán seguir utilizando las versiones antiguas hasta el 13 de junio de 2024. Si deseas obtener más información sobre esto, puedes consultar los detalles adicionales.

API de Asistentes

ayuda a los desarrolladores a crear experiencias similares a las de un asistente dentro de sus propias aplicaciones. Imagina un asistente digital específicamente diseñado que puede realizar tareas según tus instrucciones y aprovechar información adicional.

Esta nueva API ofrece muchas posibilidades. Puede ser útil para crear una aplicación que comprenda el lenguaje natural y analice datos, un asistente de programación, un planificador de viajes inteligente o incluso un DJ controlado por voz. Funciona basándose en las mismas tecnologías que impulsan nuestro nuevo producto GPT.

Una característica destacada de esta API es la capacidad de mantener conversaciones largas y complejas, lo que permite a los desarrolladores hacer cosas interesantes sin preocuparse por las limitaciones técnicas.

Además, los asistentes tienen acceso a herramientas útiles, como un intérprete de código que puede escribir y ejecutar código de programación, una función de recuperación que puede buscar información externa y una función de llamada de funciones para realizar tareas específicas.

Es importante mencionar que los datos y archivos compartidos con la API de OpenAI nunca se utilizan para entrenar nuestros modelos y los desarrolladores pueden eliminarlos cuando lo deseen. Puedes probar la versión beta de esta API sin necesidad de escribir código visitando el área de juegos de Asistentes.

Nuevas modalidades en la API

GPT-4 Turbo con visión es una novedosa función que permite que este modelo comprenda y trabaje con imágenes. Esto significa que puede hacer cosas como generar descripciones para imágenes, analizar en detalle fotos del mundo real e incluso leer documentos que contengan figuras. Por ejemplo, BeMyEyes utiliza esta tecnología para ayudar a personas ciegas o con problemas de visión a realizar tareas cotidianas, como identificar productos o navegar por una tienda.

Los desarrolladores pueden aprovechar esta función utilizando gpt-4-vision-preview en la API. Además, hemos habilitado la capacidad de visión en el modelo principal GPT-4 Turbo como parte de su lanzamiento estable. El costo de usar esta función depende del tamaño de la imagen que proporcionas. Por ejemplo, cargar una imagen con dimensiones de 1080×1080 píxeles en GPT-4 Turbo tiene un costo de $0,00765. Puedes obtener más detalles en nuestra guía de visión.

En cuanto a DALL·E 3, es otra herramienta poderosa que los desarrolladores pueden incorporar en sus aplicaciones y productos. Esta tecnología permite generar imágenes y diseños de manera programática. Grandes empresas como Snap, Coca-Cola y Shutterstock ya la están utilizando para crear contenido visual de alta calidad para sus clientes y campañas. La API de DALL·E 3 también incluye características de moderación integrada para garantizar un uso adecuado.

Además, se ha habilitado la conversión de texto a voz (TTS) a través de la API. Esto significa que los desarrolladores pueden generar voces humanas a partir de texto. Ofrecemos seis voces predefinidas para elegir, y hay dos variantes de modelo: tts-1 para casos en tiempo real y tts-1-hd para una calidad superior. Los precios comienzan en $0,015 por cada 1000 caracteres de texto convertido. Puedes obtener más información sobre cómo comenzar en nuestra guía TTS.

Personalización del modelo

  • Acceso experimental de ajuste fino de GPT-4: OpenAI está introduciendo un programa experimental que permite el ajuste fino de GPT-4. Aunque los resultados iniciales sugieren que el ajuste fino de GPT-4 puede requerir más trabajo en comparación con el modelo base en comparación con las ganancias significativas que se obtuvieron con GPT-3.5, OpenAI está trabajando en mejorar la calidad y la seguridad de este proceso. Los desarrolladores que estén utilizando activamente el ajuste fino de GPT-3.5 tendrán la opción de aplicar al programa de GPT-4 en su consola de ajuste fino a medida que esta opción esté disponible.
  • Modelos personalizados: Para organizaciones que requieren una personalización aún mayor de la que ofrece el ajuste fino, OpenAI está lanzando un programa de Modelos personalizados. Este programa permitirá a organizaciones seleccionadas colaborar con un equipo dedicado de investigadores de OpenAI para entrenar un GPT-4 personalizado para su dominio específico. Esto incluye la posibilidad de modificar cada paso del proceso de entrenamiento del modelo, desde realizar una capacitación previa específica del dominio hasta ejecutar un proceso de entrenamiento por refuerzo personalizado adaptado al dominio específico. Los modelos personalizados serán exclusivos para las organizaciones que los utilicen y no se compartirán con otros clientes ni se utilizarán para entrenar otros modelos. Los datos proporcionados para entrenar estos modelos personalizados no se reutilizarán en ningún otro contexto. Sin embargo, es importante tener en cuenta que este programa será limitado y tendrá un costo asociado. Las organizaciones interesadas pueden presentar su solicitud para participar en este programa.

Precios bajos

Se han reduciendo varios precios en toda la plataforma para trasladar los ahorros a los desarrolladores (todos los precios a continuación se expresan por 1000 tokens):

  • Los tokens de entrada GPT-4 Turbo son 3 veces más baratos que GPT-4 a $0,01 y los tokens de salida son 2 veces más baratos a $0,03.
  • Los tokens de entrada GPT-3.5 Turbo son 3 veces más baratos que el modelo anterior de 16K a $0,001 y los tokens de salida son 2 veces más baratos a $0,002. Los desarrolladores que anteriormente utilizaban GPT-3.5 Turbo 4K se benefician de una reducción del 33% en los tokens de entrada a 0,001 dólares. Esos precios más bajos sólo se aplican al nuevo GPT-3.5 Turbo presentado hoy.
  • Los tokens de entrada del modelo GPT-3.5 Turbo 4K ajustados se reducen 4 veces a $ 0,003 y los tokens de salida son 2,7 veces más baratos a $ 0,006. El ajuste fino también admite contexto de 16K al mismo precio que 4K con el nuevo modelo GPT-3.5 Turbo. Estos nuevos precios también se aplican a los modelos modificados gpt-3.5-turbo-0613.
Modelos más antiguosNuevos modelos
GPT-4 TurboGPT-4 8K Entrada: $0,03 Salida: $0,06 GPT-4 32K Entrada: $0,06 Salida: $0,12GPT-4 Turbo 128K Entrada: $0,01 Salida: $0,03
GPT-3.5 TurboGPT-3.5 Turbo 4K Entrada: $0.0015 Salida: $0.002 GPT-3.5 Turbo 16K Entrada: $0.003 Salida: $0.004GPT-3.5 Turbo 16K Entrada: $0,001 Salida: $0,002
Ajuste fino del GPT-3.5 TurboAjuste fino de GPT-3.5 Turbo 4K Entrenamiento: $0,008 Entrada: $0,012 Salida: $0,016GPT-3.5 Turbo Ajuste fino de 4K y 16K Entrenamiento: $0,008 Entrada: $0,003 Salida: $0,006

Límites de tasa más altos

Para ayudar a escalar las aplicaciones, se duplicará el límite de tokens por minuto para todos los clientes de pago de GPT-4. Se puede ver los nuevos límites de tarifas en su página de límites de tarifas . También se publicarán los niveles de uso que determinan el aumentos automáticos de los límites de tarifas, para que sepa qué esperar sobre cómo se escalarán automáticamente los límites de uso. Ahora se puede solicitar aumentos en los límites de uso desde la configuración de la cuenta.

Derechos de autor

  • OpenAI se compromete a proteger a sus clientes con salvaguardias de derechos de autor integradas en sus sistemas.
  • Hoy, la organización da un paso más allá y presenta Copyright Shield: ahora intervendrá y defenderá a sus clientes, y asumirá los costos incurridos, si estos enfrentan reclamos legales por infracción de derechos de autor.
  • Esto se aplica a las funciones generalmente disponibles de ChatGPT Enterprise y la plataforma para desarrolladores de OpenAI.

Whisper

OpenAI está lanzando Whisper large-v3, la próxima versión de su modelo de reconocimiento automático de voz (ASR) de código abierto que presenta un rendimiento mejorado en todos los idiomas. La organización también planea admitir Whisper v3 en su API en un futuro próximo.