智能客服系统实现过程-指南

最新推荐文章于 2024-06-29 16:54:14 发布

gpt4简单就能用

最新推荐文章于 2024-06-29 16:54:14 发布

阅读量795

点赞数 34

文章标签： python flask oneapi 算法人工智能机器学习交互

本文链接：https://blog.csdn.net/weixin_44067082/article/details/140015847

版权

智能客服系统实现步骤

初始化项目：
- 创建项目目录和必要的文件。
- 安装所需的 Python 包：Flask、sqlite3、openai、redis、numpy、scikit-learn、python-dotenv 等。
配置数据库和缓存：
- 使用 SQLite 作为数据库存储问答对和用户问题。
- 使用 Redis 作为缓存，提升查询效率。
定义 Flask 应用：
- 创建 Flask 应用并配置路由。
- 实现处理用户问题的 API 端点。
实现核心功能：
- 编码用户问题。
- 查找相似问题。
- 保存用户问题。
- 动态添加新的问答对。
- 提供热门词汇查询。

代码实现

1. 初始化项目

创建 app.py 文件并安装相关包：

pip install Flask sqlite3 openai redis numpy scikit-learn python-dotenv

2. 配置数据库和缓存

在项目根目录创建 .env 文件，并在其中添加 OpenAI API 密钥：

OPENAI_API_KEY=your_openai_api_key

创建初始化数据库的脚本 init_db.py：

import sqlite3

conn = sqlite3.connect('qa_corpus.db')
cursor = conn.cursor()

# 创建QA语料库表
cursor.execute('''
CREATE TABLE IF NOT EXISTS qa_corpus (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    question TEXT NOT NULL,
    answer TEXT NOT NULL
)
''')

# 创建用户问题表
cursor.execute('''
CREATE TABLE IF NOT EXISTS user_questions (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    question TEXT NOT NULL,
    resolved BOOLEAN NOT NULL
)
''')

conn.commit()
conn.close()

运行 init_db.py 初始化数据库：

python init_db.py

3. 定义 Flask 应用

在 app.py 中定义 Flask 应用和路由：

from flask import Flask, request, jsonify
import sqlite3
import redis
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import os
from dotenv import load_dotenv
import openai

# 加载环境变量
load_dotenv()

# 配置 Flask 应用
app = Flask(__name__)

# 配置 Redis 连接
redis_client = redis.Redis(host='localhost', port=6379, db=0)

# 配置 OpenAI API 密钥
openai.api_key = os.getenv("OPENAI_API_KEY")

# 配置 SQLite 数据库连接
DATABASE = 'qa_corpus.db'

# 获取数据库连接
def get_db_connection():
    conn = sqlite3.connect(DATABASE)
    conn.row_factory = sqlite3.Row
    return conn

# 缓存语料库
def cache_corpus():
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('SELECT * FROM qa_corpus')
    corpus = cursor.fetchall()
    conn.close()
    
    corpus_dict = {row['id']: {'question': row['question'], 'answer': row['answer']} for row in corpus}
    
    # 将语料库缓存到 Redis
    redis_client.set('qa_corpus', corpus_dict)

# 获取缓存的语料库
def get_cached_corpus():
    corpus = redis_client.get('qa_corpus')
    if corpus:
        return corpus
    else:
        cache_corpus()
        return redis_client.get('qa_corpus')

4. 实现核心功能

编码用户问题

# 编码用户问题
def encode_question(question):
    # 使用 OpenAI 模型对问题进行编码
    response = openai.Embedding.create(input=[question], model="text-embedding-ada-002")
    embedding = response['data'][0]['embedding']
    return np.array(embedding)

查找相似问题

# 查找相似问题
def find_similar_question(encoded_question, corpus):
    questions = [qa['question'] for qa in corpus.values()]
    
    # 使用Tf-idf进行特征编码
    vectorizer = TfidfVectorizer().fit_transform(questions)
    vectors = vectorizer.toarray()
    
    # 计算相似度
    similarities = cosine_similarity([encoded_question], vectors)
    most_similar_index = np.argmax(similarities)
    most_similar_id = list(corpus.keys())[most_similar_index]
    similarity = similarities[0][most_similar_index]
    
    return most_similar_id, similarity

保存用户问题

# 保存用户问题到数据库
def save_user_question(question, resolved):
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('INSERT INTO user_questions (question, resolved) VALUES (?, ?)', (question, resolved))
    conn.commit()
    conn.close()

处理用户问题的 API 端点

@app.route('/ask', methods=['POST'])
def ask_question():
    user_question = request.json.get('question')
    
    # 对用户问题进行编码
    encoded_question = encode_question(user_question)
    corpus = get_cached_corpus()
    similar_question_id, similarity = find_similar_question(encoded_question, corpus)
    
    # 返回相似问题的答案或默认回复
    if similarity >= 0.8:
        answer = corpus[similar_question_id]['answer']
        response = {'answer': answer, 'similarity': similarity}
    else:
        response = {'answer': '对不起，我无法理解您的问题。', 'similarity': similarity}
    
    # 保存用户问题到数据库
    save_user_question(user_question, similarity >= 0.8)
    
    return jsonify(response)

动态添加新的问答对的 API 端点

@app.route('/add_question', methods=['POST'])
def add_question():
    question = request.json.get('question')
    answer = request.json.get('answer')
    
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('INSERT INTO qa_corpus (question, answer) VALUES (?, ?)', (question, answer))
    conn.commit()
    conn.close()
    
    # 更新缓存
    cache_corpus()
    
    return jsonify({'status': 'success', 'message': '问题已成功添加到语料库中。'})

获取热门词汇的 API 端点

@app.route('/hot_words', methods=['GET'])
def hot_words():
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('SELECT question FROM user_questions')
    questions = cursor.fetchall()
    conn.close()
    
    # 分词和统计词频
    all_words = ' '.join([q['question'] for q in questions]).split()
    word_freq = {word: all_words.count(word) for word in set(all_words)}
    sorted_word_freq = sorted(word_freq.items(), key=lambda item: item[1], reverse=True)
    
    return jsonify({'hot_words': sorted_word_freq[:10]})

运行 Flask 应用

确保在启动应用之前，已经正确配置了 Redis，并且已经初始化了 SQLite 数据库。

if __name__ == '__main__':
    # 首次启动时缓存语料库
    cache_corpus()
    app.run(host='0.0.0.0', port=5000)

部署和测试

部署

确保安装并配置 Redis。
初始化 SQLite 数据库（运行 init_db.py）。
设置 OpenAI API 密钥（在 .env 文件中或环境变量中）。
运行 Flask 应用：python app.py。

测试

可以使用 curl 或 Postman 来测试 API 端点

curl -X POST http://localhost:5000/ask -H "Content-Type: application/json" -d '{"question": "你们的营业时间是？"}'

curl -X POST http://localhost:5000/add_question -H "Content-Type: application/json" -d '{"question": "你们的营业时间是？", "answer": "我们每天早上9点到晚上9点营业。"}'

```
curl http://localhost:5000/hot_words
```

代码详解

获取数据库连接

def get_db_connection():
    # 创建并返回一个 SQLite 数据库连接
    conn = sqlite3.connect(DATABASE)
    conn.row_factory = sqlite3.Row  # 使查询结果以字典形式返回
    return conn

缓存语料库

def cache_corpus():
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('SELECT * FROM qa_corpus')
    corpus = cursor.fetchall()
    conn.close()
    
    # 将语料库转换为字典形式
    corpus_dict = {row['id']: {'question': row['question'], 'answer': row['answer']} for row in corpus}
    
    # 将语料库缓存到 Redis
    redis_client.set('qa_corpus', corpus_dict)

获取缓存的语料库

def get_cached_corpus():
    # 从 Redis 获取缓存的语料库
    corpus = redis_client.get('qa_corpus')
    if corpus:
        return corpus
    else:
        # 如果缓存不存在，重新缓存语料库
        cache_corpus()
        return redis_client.get('qa_corpus')

编码用户问题

def encode_question(question):
    # 使用 OpenAI 模型对问题进行编码
    response = openai.Embedding.create(input=[question], model="text-embedding-ada-002")
    embedding = response['data'][0]['embedding']
    return np.array(embedding)

查找相似问题

def find_similar_question(encoded_question, corpus):
    # 从语料库中提取所有问题
    questions = [qa['question'] for qa in corpus.values()]
    
    # 使用Tf-idf进行特征编码
    vectorizer = TfidfVectorizer().fit_transform(questions)
    vectors = vectorizer.toarray()
    
    # 计算用户问题与语料库中问题的相似度
    similarities = cosine_similarity([encoded_question], vectors)
    most_similar_index = np.argmax(similarities)
    most_similar_id = list(corpus.keys())[most_similar_index]
    similarity = similarities[0][most_similar_index]
    
    return most_similar_id, similarity

保存用户问题

def save_user_question(question, resolved):
    # 将用户问题保存到数据库
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('INSERT INTO user_questions (question, resolved) VALUES (?, ?)', (question, resolved))
    conn.commit()
    conn.close()

API 端点实现

处理用户问题的 API 端点

@app.route('/ask', methods=['POST'])
def ask_question():
    user_question = request.json.get('question')
    
    # 对用户问题进行编码
    encoded_question = encode_question(user_question)
    corpus = get_cached_corpus()
    similar_question_id, similarity = find_similar_question(encoded_question, corpus)
    
    # 返回相似问题的答案或默认回复
    if similarity >= 0.8:
        answer = corpus[similar_question_id]['answer']
        response = {'answer': answer, 'similarity': similarity}
    else:
        response = {'answer': '对不起，我无法理解您的问题。', 'similarity': similarity}
    
    # 保存用户问题到数据库
    save_user_question(user_question, similarity >= 0.8)
    
    return jsonify(response)

动态添加新的问答对的 API 端点

@app.route('/add_question', methods=['POST'])
def add_question():
    question = request.json.get('question')
    answer = request.json.get('answer')
    
    # 将新的问答对插入到数据库
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('INSERT INTO qa_corpus (question, answer) VALUES (?, ?)', (question, answer))
    conn.commit()
    conn.close()
    
    # 更新缓存
    cache_corpus()
    
    return jsonify({'status': 'success', 'message': '问题已成功添加到语料库中。'})

获取热门词汇的 API 端点

@app.route('/hot_words', methods=['GET'])
def hot_words():
    conn = get_db_connection()
    cursor = conn.cursor()
    cursor.execute('SELECT question FROM user_questions')
    questions = cursor.fetchall()
    conn.close()
    
    # 分词和统计词频
    all_words = ' '.join([q['question'] for q in questions]).split()
    word_freq = {word: all_words.count(word) for word in set(all_words)}
    sorted_word_freq = sorted(word_freq.items(), key=lambda item: item[1], reverse=True)
    
    return jsonify({'hot_words': sorted_word_freq[:10]})

运行 Flask 应用

确保在启动应用之前，已经正确配置了 Redis，并且已经初始化了 SQLite 数据库。

if __name__ == '__main__':
    # 首次启动时缓存语料库
    cache_corpus()
    app.run(host='0.0.0.0', port=5000)

部署和测试

部署

安装 Redis：
- 在本地或服务器上安装并启动 Redis 服务。可以参考 Redis 官方文档进行安装：Redis 安装指南
```
python init_db.py
```
设置 OpenAI API 密钥：
- 在项目根目录创建 .env 文件，并添加你的 OpenAI API 密钥。
```
OPENAI_API_KEY=your_openai_api_key
```
```
python app.py
```

测试

可以使用 curl 或 Postman 来测试 API 端点

curl -X POST http://localhost:5000/ask -H "Content-Type: application/json" -d '{"question": "你们的营业时间是？"}'

响应示例：

json

{
    "answer": "我们每天早上9点到晚上9点营业。",
    "similarity": 0.95
}

curl -X POST http://localhost:5000/add_question -H "Content-Type: application/json" -d '{"question": "你们的营业时间是？", "answer": "我们每天早上9点到晚上9点营业。"}'

响应示例：

json

{
    "status": "success",
    "message": "问题已成功添加到语料库中。"
}

curl http://localhost:5000/hot_words

响应示例：

json

{
    "hot_words": [
        ["营业时间", 5],
        ["你们", 4],
        ["是", 3],
        ["什么", 2],
        ["时间", 2],
        ["几点", 1],
        ["到", 1],
        ["晚上", 1],
        ["早上", 1],
        ["我们", 1]
    ]
}

代码模块的作用及其好处

数据库模块：
- 作用：存储和管理问答对及用户问题。
- 好处：持久化存储数据，确保数据的可靠性和一致性。
缓存模块：
- 作用：使用 Redis 缓存问答对，提升查询效率。
- 好处：减少数据库查询次数，提高系统响应速度。
编码模块：
- 作用：使用 OpenAI 模型对用户问题进行编码。
- 好处：将自然语言转化为向量表示，便于相似度计算。
相似度计算模块：
- 作用：计算用户问题与语料库中问题的相似度。
- 好处：找到最相似的问题，提供相关答案，提高用户满意度。
API 模块：
- 作用：提供处理用户问题、添加新问答对、获取热门词汇的 API 接口。
- 好处：通过标准接口与前端或其他系统集成，提升系统的可扩展性和易用性。