OpenAI lanza Model Spec, un conjunto de directrices para el comportamiento óptimo de la inteligencia artificial

Internet 08/05/2024 Daniel Lamps Daniel Lamps
chatgpt
OpenAI lanza Model Spec, un conjunto de directrices para el comportamiento óptimo de la inteligencia artificial

OpenAI ha introducido un nuevo documento que guiará el desarrollo de sus modelos de inteligencia artificial. Denominado Model Spec, este documento abarca elementos esenciales como el tono, la personalidad y la longitud de las respuestas de los modelos de lenguaje ante las preguntas de los usuarios.

Model Spec consolida los objetivos, normas y valores que se implementan en los modelos de IA de OpenAI. Según la compañía, este primer documento esboza su estrategia para configurar los modelos y aborda cómo se manejarán los conflictos mediante diversas reglas.

Este conjunto de especificaciones funciona como un marco de referencia que permite a expertos, investigadores y al público en general comprender cómo OpenAI gestiona esta tecnología y sus posibles errores. A diferencia de otras empresas de IA como Meta o Apple, los modelos de OpenAI no son de código abierto, lo que complica el análisis de su funcionamiento.

Por esta razón, Sam Altman y su equipo han publicado este documento para recoger comentarios y realizar mejoras continuas.

AI robot

¿Qué es Model Spec de OpenAI?


El nuevo chip de inteligencia artificial de OpenAI está diseñado para optimizar sus modelos.
Según el primer documento presentado, Model Spec define cómo deben comportarse los modelos de la API de OpenAI y ChatGPT. Este documento establece objetivos clave y proporciona directrices sobre cómo manejar instrucciones o metas que se contraponen.

Los objetivos clave son principios que guían el comportamiento deseado de los modelos. Estos modelos están diseñados para asistir a los usuarios, cumpliendo instrucciones y ofreciendo respuestas beneficiosas. En este proceso, evalúan los beneficios y riesgos potenciales, cumplen con la ley y respetan las normas sociales. Al igual que los principios de OpenAI, la meta es que la inteligencia artificial resulte en beneficios para la humanidad.

Para alcanzar estos objetivos, es crucial seguir una serie de directrices que aseguren la seguridad. Las normas de Model Spec dictan que un modelo debe obedecer la jerarquía establecida, mostrar respeto hacia las personas y acatar las leyes vigentes. Además, la inteligencia artificial debe salvaguardar la privacidad de los usuarios y evitar emitir contenido NSFW, como material pornográfico o violento.

Con los objetivos y normas claramente establecidos, se define un comportamiento estándar para los modelos. Según OpenAI, estas directrices permitirán que la IA resuelva conflictos, priorice y equilibre metas.

Un modelo debe presumir buenas intenciones por parte del usuario, realizar preguntas cuando sea necesario y ser útil sin sobrepasar los límites. Siempre debe mantener una perspectiva objetiva y promover la bondad en lugar del odio. Si el usuario posee una opinión diferente, la IA debe evitar intentar cambiarla o mostrar indecisión.
 
 chatgpt
 

¿Qué modelos aplicarán estas normativas?

OpenAI ha indicado que el documento describe un comportamiento ideal para sus modelos, pero todavía no se implementan estas especificaciones en su forma actual. Es probable que estas normas se utilicen como fundamento para el desarrollo de GPT-5, la próxima generación de su modelo de lenguaje.

"Publicamos las especificaciones del modelo para aumentar la transparencia sobre cómo diseñamos el comportamiento del modelo y para comenzar un diálogo público sobre posibles modificaciones y mejoras", explicó la empresa. "La especificación, al igual que nuestros modelos, se actualizará constantemente basándose en las lecciones que obtengamos al compartirla y al recibir retroalimentación de las partes interesadas."

La compañía también planea presentar este documento a expertos, reguladores e instituciones para evaluar su enfoque y determinar si hay objetivos adicionales que deban considerarse. OpenAI recogerá también opiniones del público general y se comprometió a publicar una actualización con todos los cambios realizados a partir del próximo año.