OpenAI Agent 代码实现

莫尔索随笔

已于 2024-04-25 11:27:55 修改

阅读量608

点赞数 1

分类专栏： LLM应用构建实践笔记大语言模型开发者教程文章标签： python 人工智能 AI编程 chatgpt 后端文心一言

于 2023-07-07 13:54:22 首次发布

本文链接：https://blog.csdn.net/weixin_43829633/article/details/131595116

版权

LLM应用构建实践笔记同时被 2 个专栏收录

27 篇文章 13 订阅

订阅专栏

大语言模型开发者教程

23 篇文章 2 订阅

订阅专栏

本文首发自个人博客，更多LLM应用构建相关内容，请点击前往查看。

我的新书《LangChain编程从入门到实践》已经开售！推荐正在学习AI应用开发的朋友购买阅读！

OpenAI Function Calling 特性有什么用

OpenAI 在gpt-3.5-turbo-0613 和 gpt-4-0613两个模型的chat completion api中增加了一个叫 Function Calling 的新功能，本篇文章对其功能进行探究，并分析其作用。

Function Calling使用

我认为这是一种比Plugin更优雅的方式，给开发者提供了更多的自由度，一方面识别出何时需要调用函数来对输出格式化，一方面设定具体的格式化数据有助于接入后续业务逻辑。达到尽可能保证（注意这里，是根据你的函数描述最大可能保证，不能100%）LLM输出可控的基础上，来增强自己业务的目的。

show me code

下面以记账应用为例，告诉AI：“今天喝奶茶花了6元”，正常思路来说，交互流程应该是这样的：

用户输入prompt
AI进行语义分析
返回结构化的数据（每个子项是什么，花费是多少）
拿到数据进行下一步操作

借助Function Calling，微调后的模型可以检测何时应该调用函数并使用符合函数签名的 JSON 进行响应，下面看代码例子👇

import openai
import json
from enum import Enum

class BaseTool(Enum):
    Bookkeeping = "record_price"
    RecordingTask = "record_task"
    
def record_price(category, price):
    print(category, price)
    # 记账应用 API
    print("记账成功!")

def funtion_call_conversation():
    response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo-0613",
    messages=[
      {"role": "user", "content": "今天喝奶茶花了6元"},
    ],
    temperature=0,
    functions=[
      {
        "name": BaseTool.Bookkeeping.value,
        "description": "bookkeeping assistant",
        "parameters": {
          "type": "object",
          "properties": {
            "category": {
              "type": "string",
              "description": "类目",
            },
            "price": {"type": "string", "description": "金额"},
          },
          "required": ["category", "price"],
        },
      }
    ],
    function_call="auto",
    )
    message = response["choices"][0]["message"]
    if(message.get("function_call")):
        function_name = message["function_call"]["name"]
        if function_name == BaseTool.Bookkeeping.value:
            arguments = json.loads(message["function_call"]["arguments"])
            record_price(arguments.get('category'), arguments.get('price'))

接口调用说明

name字段表示要调用的函数名，description表示函数描述，paramters是一个符合JSON Schema格式的对象，用来描述这个函数的入参信息（让 LLM 读得懂的工具函数说明）
record_price是用来给Function Calling调用的函数，这个函数接收两个必填的参数，category类目（string类型），price金额（string类型）

functions=[
  {
    "name": BaseTool.Bookkeeping.value,
    "description": "bookkeeping assistant",
    "parameters": {
      "type": "object",
      "properties": {
        "category": {"type": "string","description": "类目"},
        "price": {"type": "string", "description": "金额"},
      },
      "required": ["category", "price"],
    },
  }
],

LLM分析结果

LLM 分析后命中了函数签名描述，就会返回给我们 function_call 这个字段以及函数签名中我们预定义的相关信息：

{
  "role": "assistant",
  "content": null,
  "function_call": {
    "name": "record_price",
    "arguments": "{\n  \"category\": \"\u5976\u8336\",\n  \"price\": \"6\u5143\"\n}"
  }
}

category返回给我们了类目是奶茶
price识别出了金额是6元

接下来拿到参数，调用 record_price 进行记账的操作即可；如果没有命中函数签名描述，就不会返回function_call字段，也就不需要进行任何操作：

    if(message.get("function_call")):
        function_name = message["function_call"]["name"]
        if function_name == BaseTool.Bookkeeping.value:
            arguments = json.loads(message["function_call"]["arguments"])
            record_price(arguments.get('category'), arguments.get('price'))

按照这种思路，可以扩展自己的外部工具，比如发邮件，记录待办清单，让LLM变成私人管家。

AI记账应用设想

LLM 加持的记账应用设想，不需要打开记账软件写类目记金额👇：

直接对照Siri说“今天喝奶茶花了6元”
然后利用STT，转换为文本
利用上述程序提取类目和金额，调用记账API，记录成功

存在问题

函数描述是会被计入token的（果然魔法都是有成本的🤡
潜在的风险：分析不准确，出现无法命中函数签名描述的情况

参考

莫尔索随笔

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
OpenAI Agent 代码实现

OpenAI 在gpt-3.5-turbo-0613 和 gpt-4-0613两个模型的chat completion api中增加了一个叫的新功能，本篇文章对其功能进行探究，并分析其作用。
复制链接

扫一扫

专栏目录