OpenAI Agent 代码实现

本文首发自个人博客,更多LLM应用构建相关内容,请点击前往查看。

我的新书《LangChain编程从入门到实践》 已经开售!推荐正在学习AI应用开发的朋友购买阅读!
LangChain编程从入门到实践

OpenAI Function Calling 特性有什么用

OpenAI 在gpt-3.5-turbo-0613 和 gpt-4-0613两个模型的chat completion api中增加了一个叫 Function Calling 的新功能,本篇文章对其功能进行探究,并分析其作用。

Function Calling使用

我认为这是一种比Plugin更优雅的方式,给开发者提供了更多的自由度,一方面识别出何时需要调用函数来对输出格式化,一方面设定具体的格式化数据有助于接入后续业务逻辑。达到尽可能保证(注意这里,是根据你的函数描述最大可能保证,不能100%)LLM输出可控的基础上,来增强自己业务的目的。

show me code

下面以记账应用为例,告诉AI:“今天喝奶茶花了6元”,正常思路来说,交互流程应该是这样的:

  • 用户输入prompt
  • AI进行语义分析
  • 返回结构化的数据(每个子项是什么,花费是多少)
  • 拿到数据进行下一步操作

借助Function Calling,微调后的模型可以检测何时应该调用函数并使用符合函数签名的 JSON 进行响应,下面看代码例子👇

import openai
import json
from enum import Enum

class BaseTool(Enum):
    Bookkeeping = "record_price"
    RecordingTask = "record_task"
    
def record_price(category, price):
    print(category, price)
    # 记账应用 API
    print("记账成功!")

def funtion_call_conversation():
    response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo-0613",
    messages=[
      {"role": "user", "content": "今天喝奶茶花了6元"},
    ],
    temperature=0,
    functions=[
      {
        "name": BaseTool.Bookkeeping.value,
        "description": "bookkeeping assistant",
        "parameters": {
          "type": "object",
          "properties": {
            "category": {
              "type": "string",
              "description": "类目",
            },
            "price": {"type": "string", "description": "金额"},
          },
          "required": ["category", "price"],
        },
      }
    ],
    function_call="auto",
    )
    message = response["choices"][0]["message"]
    if(message.get("function_call")):
        function_name = message["function_call"]["name"]
        if function_name == BaseTool.Bookkeeping.value:
            arguments = json.loads(message["function_call"]["arguments"])
            record_price(arguments.get('category'), arguments.get('price'))
接口调用说明
  • name字段表示要调用的函数名,description表示函数描述,paramters是一个符合JSON Schema格式的对象,用来描述这个函数的入参信息(让 LLM 读得懂的工具函数说明)
  • record_price是用来给Function Calling调用的函数,这个函数接收两个必填的参数,category类目(string类型),price金额(string类型)
functions=[
  {
    "name": BaseTool.Bookkeeping.value,
    "description": "bookkeeping assistant",
    "parameters": {
      "type": "object",
      "properties": {
        "category": {"type": "string","description": "类目"},
        "price": {"type": "string", "description": "金额"},
      },
      "required": ["category", "price"],
    },
  }
],
LLM分析结果

LLM 分析后命中了函数签名描述,就会返回给我们 function_call 这个字段以及函数签名中我们预定义的相关信息:

{
  "role": "assistant",
  "content": null,
  "function_call": {
    "name": "record_price",
    "arguments": "{\n  \"category\": \"\u5976\u8336\",\n  \"price\": \"6\u5143\"\n}"
  }
}
  • category返回给我们了类目是奶茶
  • price识别出了金额是6元

接下来拿到参数,调用 record_price 进行记账的操作即可;如果没有命中函数签名描述,就不会返回function_call字段,也就不需要进行任何操作:

    if(message.get("function_call")):
        function_name = message["function_call"]["name"]
        if function_name == BaseTool.Bookkeeping.value:
            arguments = json.loads(message["function_call"]["arguments"])
            record_price(arguments.get('category'), arguments.get('price'))

按照这种思路,可以扩展自己的外部工具,比如发邮件,记录待办清单,让LLM变成私人管家。

AI记账应用设想

LLM 加持的记账应用设想,不需要打开记账软件写类目记金额👇:

  1. 直接对照Siri说“今天喝奶茶花了6元”
  2. 然后利用STT,转换为文本
  3. 利用上述程序提取类目和金额,调用记账API,记录成功

存在问题

  1. 函数描述是会被计入token的(果然魔法都是有成本的🤡
  2. 潜在的风险:分析不准确,出现无法命中函数签名描述的情况

参考

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值