震惊！OpenAI API结构化输出准确率100%

程序猿李巡天

于 2024-08-08 20:46:34 发布

阅读量429

点赞数 22

文章标签： java 前端服务器人工智能知识图谱学习 linux

本文链接：https://blog.csdn.net/m0_59235945/article/details/141036014

版权

OpenAI开发者的福音

程序员们，你们是否曾为模型输出的不一致性而头疼？是否曾花费大量时间尝试不同的提示词，以期获得理想的输出结果？现在，OpenAI带来了一个令人振奋的消息——API支持结构化输出了！

这意味着，你只需定义一个JSON Schema，AI就会按照你的指令输出数据，而且准确率可达100%！

技术原理解析

OpenAI采用了一种称为约束解码的技术，通过将JSON Schema转换为上下文无关文法（CFG），在模型生成输出时，确保每个token都符合提供的schema。这种方法不仅提高了输出的准确性，还减少了不必要的延迟。

使用方式介绍

在API中，你可以通过两种方式引入结构化输出：

函数调用：在函数定义中设置strict: true，模型输出将与工具定义匹配。

请求demo

{     "model": "gpt-4o-2024-08-06",     "messages": [       {         "role": "system",         "content": "You are a helpful assistant. The current date is August 6, 2024. You help users query for the data they are looking for by calling the query function."       },       {         "role": "user",         "content": "look up all my orders in may of last year that were fulfilled but not delivered on time"       }     ],     "tools": [       {         "type": "function",         "function": {           "name": "query",           "description": "Execute a query.",           "strict": true,           "parameters": {             "type": "object",             "properties": {               "table_name": {                 "type": "string",                 "enum": ["orders"]               },               "columns": {                 "type": "array",                 "items": {                   "type": "string",                   "enum": [                     "id",                     "status",                     "expected_delivery_date",                     "delivered_at",                     "shipped_at",                     "ordered_at",                     "canceled_at"                   ]                 }               },               "conditions": {                 "type": "array",                 "items": {                   "type": "object",                   "properties": {                     "column": {                       "type": "string"                     },                     "operator": {                       "type": "string",                       "enum": ["=", ">", "<", ">=", "<=", "!="]                     },                     "value": {                       "anyOf": [                         {                           "type": "string"                         },                         {                           "type": "number"                         },                         {                           "type": "object",                           "properties": {                             "column_name": {                               "type": "string"                             }                           },                           "required": ["column_name"],                           "additionalProperties": false                         }                       ]                     }                   },                   "required": ["column", "operator", "value"],                   "additionalProperties": false                 }               },               "order_by": {                 "type": "string",                 "enum": ["asc", "desc"]               }             },             "required": ["table_name", "columns", "conditions", "order_by"],             "additionalProperties": false           }         }       }     ]   }

输出demo

  `"table_name": "orders",     "columns": ["id", "status", "expected_delivery_date", "delivered_at"],     "conditions": [       {         "column": "status",         "operator": "=",         "value": "fulfilled"       },       {         "column": "ordered_at",         "operator": ">=",         "value": "2023-05-01"       },       {         "column": "ordered_at",         "operator": "<",         "value": "2023-06-01"       },       {         "column": "delivered_at",         "operator": ">",         "value": {           "column_name": "expected_delivery_date"         }       }     ],     "order_by": "asc"   }`

response_format参数：开发人员可以通过这个新选项选择需要的输出格式，当模型以结构化方式响应用户时，这一功能非常有用。

请求demo

{     "model": "gpt-4o-2024-08-06",     "messages": [       {         "role": "system",         "content": "You are a helpful math tutor."       },       {         "role": "user",         "content": "solve 8x + 31 = 2"       }     ],     "response_format": {       "type": "json_schema",       "json_schema": {         "name": "math_response",         "strict": true,         "schema": {           "type": "object",           "properties": {             "steps": {               "type": "array",               "items": {                 "type": "object",                 "properties": {                   "explanation": {                     "type": "string"                   },                   "output": {                     "type": "string"                   }                 },                 "required": ["explanation", "output"],                 "additionalProperties": false               }             },             "final_answer": {               "type": "string"             }           },           "required": ["steps", "final_answer"],           "additionalProperties": false         }       }     }   }

输出demo

  `"steps": [       {         "explanation": "Subtract 31 from both sides to isolate the term with x.",         "output": "8x + 31 - 31 = 2 - 31"       },       {         "explanation": "This simplifies to 8x = -29.",         "output": "8x = -29"       },       {         "explanation": "Divide both sides by 8 to solve for x.",         "output": "x = -29 / 8"       }     ],     "final_answer": "x = -29 / 8"   }`

成本节省亮点

使用结构化输出的另一个好处是成本的大幅降低。与之前的版本相比，输入端成本节省了50%，输出端节省了33%。这对于初创公司和个人开发者来说，无疑是一个巨大的吸引力。

原生SDK支持

OpenAI的Python和Node SDK已经更新，原生支持结构化输出。这意味着，为工具提供架构或响应格式就像提供Pydantic或Zod对象一样简单，SDK能自动将JSON响应反序列化为类型化数据结构。

用例列举

结构化输出的应用场景非常广泛，例如：

动态生成用户界面
将最终答案与支撑性的推理或附加评论分开
从非结构化数据中提取结构化数据

安全保障

安全始终是OpenAI的首要考虑。新的结构化输出功能遵守OpenAI现有的安全政策，允许模型拒绝不安全的请求。API响应上的新的refusal字符串值，使开发人员能够以编程方式检测模型是否生成了拒绝。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

程序猿李巡天

关注

22
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
震惊！OpenAI API结构化输出准确率100%

函数调用：在函数定义中设置，模型输出将与工具定义匹配。请求demo输出demoresponse_format参数：开发人员可以通过这个新选项选择需要的输出格式，当模型以结构化方式响应用户时，这一功能非常有用。请求demo输出demo。
复制链接

扫一扫