给大模型装上手,通过 Function Calling 查询数据库:实现高效数据处理的新方式

原创

在当今数字化时代,数据驱动决策已经成为企业发展的关键。随着数据库技术的不断发展,查询数据库的方式也在不断演变。传统的数据库查询方式虽然功能强大,但有时显得复杂和冗长。而Function Calling(函数调用)提供了一种更加简洁、高效的数据库查询方式。本文将介绍Function Calling查询数据库的原理、优势以及实际应用案例。

一、什么是Function Calling?

Function Calling,顾名思义,就是通过调用函数的方式来完成特定任务。在数据库查询中,Function Calling指的是将查询操作封装成函数,通过调用这些函数来完成数据库查询。与传统的SQL查询语句不同,Function Calling具有更高的可读性和复用性。

二、Function Calling查询数据库的优势
  1. 简洁明了:Function Calling将复杂的查询操作封装在函数内部,调用时只需简短的函数名称和参数,极大简化了查询语句。
  2. 高效复用:常用的查询操作可以封装成函数,方便在不同的项目或模块中复用,减少重复代码,提高开发效率。
  3. 易于维护:由于查询逻辑集中在函数内部,当需要修改查询逻辑时,只需更新函数定义,无需逐个修改所有使用到该查询的地方。
  4. 安全性高:通过预定义的函数进行数据库操作,可以有效防止SQL注入等安全问题,增强系统的安全性。
三、Function Calling查询数据库的实现

以Python为例,实现数据库查询:

# 导入必要的库
import openai
import os
from math import *
from icecream import ic
import jsonfrom math import *
import requestsimport logging
import sqlite3

# 设置日志记录配置
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# 加载 .env 文件
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

# 从环境变量中获得你的 OpenAI Key
openai.api_key = os.getenv('OPENAI_API_KEY')
openai.api_base = os.getenv('OPENAI_API_URL')
model = os.getenv('MODEL')
amap_key = os.getenv('GAODE_MAP_API_KEY')

# 定义数据库表结构的字符串
database_schema_string = """
CREATE TABLE customers (
    id INT PRIMARY KEY NOT NULL, -- 主键,不允许为空    
    customer_name VARCHAR(255) NOT NULL, -- 客户名,不允许为空    
    email VARCHAR(255) UNIQUE, -- 邮箱,唯一    
    register_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP -- 注册时间,默认为当前时间
);
CREATE TABLE products (
    id INT PRIMARY KEY NOT NULL, -- 主键,不允许为空    
    product_name VARCHAR(255) NOT NULL, -- 产品名称,不允许为空    
    price DECIMAL(10,2) NOT NULL -- 价格,不允许为空
);
CREATE TABLE orders (
    id INT PRIMARY KEY NOT NULL, -- 主键,不允许为空    
    customer_id INT NOT NULL, -- 客户ID,不允许为空    
    product_id INT NOT NULL, -- 产品ID,不允许为空    
    price DECIMAL(10,2) NOT NULL, -- 价格,不允许为空    
    status INT NOT NULL, -- 订单状态,整数类型,不允许为空。0代表待支付,1代表已支付,2代表已退款    
    create_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP, -- 创建时间,默认为当前时间    
    pay_time TIMESTAMP -- 支付时间,可以为空
);
"""
def get_sql_completion(messages, model=model):
    """    
    使用 OpenAI 的 Chat API 来生成完成的 SQL 查询语句。      
      
    参数:    
    - messages: 一个包含用户消息和系统消息的列表,用于上下文对话。    
    - model: 使用的 OpenAI 模型的名称,默认为环境变量中定义的模型。     
   
    返回:    
    - 生成的 SQL 查询语句。    
    """    
    response = openai.ChatCompletion.create(    
        model=model,        
        messages=messages,        
        temperature=0,  # 模型输出的随机性,0 表示随机性最小        
        tools=[{  # 摘自 OpenAI 官方示例 https://github.com/openai/openai-cookbook/blob/main/examples/How_to_call_functions_with_chat_models.ipynb        
            "type": "function",            
            "function": {             
                "name": "ask_database",                
                "description": "Use this function to answer user questions about business. \     
                            Output should be a fully formed SQL query.",#使用此功能可以回答用户有关业务的问题\输出应该是完全格式的SQL查询。                
                "parameters": {                  
                    "type": "object",                 
                    "properties": {                     
                        "query": {                       
                            "type": "string",                            
                            #SQL查询提取信息以回答用户的问题。SQL应该使用以下数据库架构编写:\                            
                            #查询应以纯文本形式返回,而不是以JSON形式返回。查询应该只包含SQLite支持的语法。                            
                            "description": f"""                            
                            SQL query extracting info to answer the user's question.                             
                            SQL should be written using this database schema:                            
                            {database_schema_string}                            
                            The query should be returned in plain text, not in JSON.                            
                            The query should only contain grammars supported by SQLite.                            
                            """,                        
                        }                    
                    },                    
                    "required": ["query"],               
                }            
            }        
        }],   
    )    
    return response.choices[0].message

# 创建内存中的SQLite数据库连接
conn = sqlite3.connect(':memory:')
cursor = conn.cursor()

# 执行数据库表创建语句
for statement in database_schema_string.split(';'): 
    cursor.execute(statement)

# 插入模拟数据
mock_data = [
    (1, 1001, 'TSHIRT_1', 50.00, 0, '2023-10-12 10:00:00', None),    
    (2, 1001, 'TSHIRT_2', 75.50, 1, '2023-10-16 11:00:00', '2023-08-16 12:00:00'),    
    (3, 1002, 'SHOES_X2', 25.25, 2, '2023-10-17 12:30:00', '2023-08-17 13:00:00'),    
    (4, 1003, 'HAT_Z112', 60.75, 1, '2023-10-20 14:00:00', '2023-08-20 15:00:00'),    
    (5, 1002, 'WATCH_X001', 90.00, 0, '2023-10-28 16:00:00', None)
]

for record in mock_data:
    cursor.execute('''\    
    INSERT INTO orders (id, customer_id, product_id, price, status, create_time, pay_time)    VALUES (?, ?, ?, ?, ?, ?, ?)    
    ''', record)
# 提交事务
conn.commit()

def ask_database(query):
    """    
    执行 SQL 查询并返回结果。    
        
    参数:    
    - query: 要执行的 SQL 查询语句。    
    -     
    - 返回:    - 查询结果。    
    """    
    cursor.execute(query)    
    records = cursor.fetchall()    
    return records

def test_promopt(): 
    """    
    测试通过自然语言询问来生成并执行 SQL 查询的功能。    
    """    
    prompt = "统计每月每件商品的销售额"    
    # prompt = "这星期消费最高的用户是谁?他买了哪些商品? 每件商品买了几件?花费多少?"    
    messages = [    
        {"role": "system", "content": "基于 order 表回答用户问题"},        
        {"role": "user", "content": prompt}    
    ]    
    response = get_sql_completion(messages)    
    print(response)    
    conn.close()

def test_promopt_result():
    """    
    测试自然语言询问的更复杂场景,包括对数据库操作的调用和日志记录。    
    """    
    prompt = "统计每月每件商品的销售额"    
    # prompt = "这星期消费最高的用户是谁?他买了哪些商品? 每件商品买了几件?花费多少?"    
    messages = [    
        {"role": "system", "content": "基于 order 表回答用户问题"},        
        {"role": "user", "content": prompt}    
    ]    
    response = get_sql_completion(messages)    
    if response.content is None:    
        response.content = "null"    
    messages.append(response)    
    logging.info("====Function Calling====")    
    logging.info(response)    
    
    if response.tool_calls is not None:    
        tool_call = response.tool_calls[0]        
        if tool_call.function.name == "ask_database":       
            arguments = tool_call.function.arguments            
            args = json.loads(arguments)            
            logging.info("====SQL====")            
            logging.info(args["query"])            
            result = ask_database(args["query"])            
            logging.info("====DB Records====")            
            logging.info(result)        
                
            messages.append({                
                "tool_call_id": tool_call.id,                
                "role": "tool",                
                "name": "ask_database",                
                "content": str(result)            
            })            
            response = get_sql_completion(messages)            
            logging.info("====最终回复====")            
            logging.info(response.content)    
    conn.close()


if __name__ == '__main__': 
   test_promopt_result()

输出:

2024-05-31 23:12:38,331 - INFO - ====Function Calling====
2024-05-31 23:12:38,332 - INFO - {
  "role": "assistant",  
  "content": "null",  
  "tool_calls": [  
    {   
      "id": "call_zhket5tQwLB9jGukvB2GpfMX",      
      "type": "function",      
      "function": {      
        "name": "ask_database",        
        "arguments": "{\"query\":\"SELECT strftime('%Y-%m', create_time) AS month, product_id, SUM(price) AS total_sales FROM orders WHERE status = 1 GROUP BY month, product_id;\"}"     
      }    
    }  
  ]
}
2024-05-31 23:12:38,334 - INFO - ====SQL====
2024-05-31 23:12:38,334 - INFO - SELECT strftime('%Y-%m', create_time) AS month, product_id, SUM(price) AS total_sales FROM orders WHERE status = 1 GROUP BY month, product_id;
2024-05-31 23:12:38,335 - INFO - ====DB Records====
2024-05-31 23:12:38,335 - INFO - [('2023-10', 'HAT_Z112', 60.75), ('2023-10', 'TSHIRT_2', 75.5)]
2024-05-31 23:12:41,284 - INFO - ====最终回复====
2024-05-31 23:12:41,285 - INFO - 每月每件商品的销售额统计如下:

- 2023年10月:
  - 商品ID:HAT_Z112,销售额:60.75  
  - 商品ID:TSHIRT_2,销售额:75.5

在以上示例中,通过调用函数实现了对数据库的查询。这样做不仅代码更加简洁易读,还方便了查询逻辑的复用和维护。

四、实际应用案例
  1. 电商平台的商品查询:在电商平台中,商品查询是非常频繁的操作。通过Function Calling,可以将不同条件的商品查询封装成函数,例如按价格区间、按分类、按销量排序等,大大提高了查询的灵活性和效率。

  2. 用户管理系统:在用户管理系统中,可以将用户的增删改查操作封装成函数,例如根据用户ID查询、按注册时间排序、批量删除用户等,使系统更易于维护和扩展。

  3. 数据分析系统:在数据分析系统中,常常需要对大量数据进行复杂查询和统计。通过Function Calling,可以将常用的统计分析操作封装成函数,例如按时间段统计销售额、按地区统计用户数量等,提高了数据处理的效率和准确性。

五、总结

Function Calling查询数据库作为一种新兴的技术手段,正在逐渐受到开发者的青睐。它不仅简化了数据库查询操作,提高了代码的可读性和复用性,还增强了系统的安全性和维护性。在未来,随着数据库技术的不断发展,相信Function Calling将会在更多领域发挥重要作用,助力企业实现更高效的数据处理和决策支持。

希望本文能够为大家提供一些有益的参考,让我们共同探索Function Calling的更多可能性,推动技术的进步和应用的发展。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值