Blogs y noticias

OpenAI da a los desarrolladores la herramienta para llevar las conversaciones naturales en tiempo real a sus apps de IA

OpenAI ha facilitado a los desarrolladores nuevas herramientas con las que personalizar sus modelos y crear aplicaciones de inteligencia artificial (IA) que incluyen conversaciones en tiempo real con voz natural e incorporen y mejoren la comprensión de imágenes.

La compañía tecnológica ha celebrado este martes en San Francisco (Estados Unidos) su evento de desarrolladores DevDay 2024, en el que ha anunciado nuevas herramientas para la personalización de sus modelos de IA.

Los desarrolladores pueden acceder a un nuevo proceso de destilación de modelos que se integra en la plataforma de OpenAI para que puedan utilizar los resultados de modelos de mayor capacidad, como o1-preview y GPT-4o, para afinar otros más pequeños y rentables, como GPT-4o mini.

Este proceso se encuentra en una nueva ‘suite’ que permite a los desarrolladores generar conjuntos de datos para destilación, crear y ejecutar evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en la oferta de ajuste de OpenAI.

Los desarrolladores también pueden realizar ajustes en GPT-4o con imágenes, además de con texto, con la nueva herramienta de ajuste fino de visión. De esta forma, pueden incorporar capacidades de comprensión de imágenes para ofrecer funciones de búsqueda visual o de detección de objetos.

‘Prompt Caching’ es una herramienta diseñada para que los desarrolladores ahorren costes y tiempo al permitir guardar en caché el contexto usado de manera frecuente en múltiples llamadas de API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, y sus versiones optimizadas.

“La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, comenzando con 1024 tokens y aumentando en incrementos de 128 tokens. Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API”, explica la compañía en el blog oficial.

Una última novedad anunciada en DevDay es ‘Realtime API’, un recurso con el que los desarrolladores pueden crear experiencias rápidas de conversión de voz a voz en sus aplicaciones. Está actualmente en una fase de beta pública, y es similar al modo de voz avanzado de ChatGPT, admite conversaciones naturales con una de la seis voces predefinidas.

Compartir articulo

Facebook
Twitter
WhatsApp
Email
Author picture

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Las Ultimas Noticias

Al acecho del CJNG: Detienen al ‘Chava’, hombre cercano al ‘Mencho’, en Jalisco
Del odio al amor solo hay… ¿5 minutos? Así fue el nuevo ‘encontronazo’ entre Noroña...
Impresiona OneRepublic a 10 mil 200 fans en la CDMX
Diputados aprueban en lo general reforma energética: ¿De qué trata?

Noticias Recientes

Clima

Nuestras redes sociales