基于Dify的智能分类方案：大模型结合KNN算法（附代码）

最新推荐文章于 2025-03-06 18:24:06 发布

写代码的中青年

最新推荐文章于 2025-03-06 18:24:06 发布

阅读量2.9k

点赞数 45

分类专栏：大模型文章标签： chatgpt 人工智能大模型 LLM python 分类算法

本文链接：https://blog.csdn.net/qq_43128256/article/details/139914044

版权

大模型专栏收录该内容

69 篇文章

订阅专栏

大模型相关目录

大模型，包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步，扬帆起航。

大模型应用向开发路径：AI代理工作流
大模型应用开发实用开源项目汇总
大模型问答项目问答性能评估方法
大模型数据侧总结
大模型token等基本概念及参数和内存的关系
大模型应用开发-华为大模型生态规划
从零开始的LLaMA-Factory的指令增量微调
基于实体抽取-SMC-语义向量的大模型能力评估通用算法（附代码）
基于Langchain-chatchat的向量库构建及检索（附代码）
一文教你成为合格的Prompt工程师
最简明的大模型agent教程
批量使用API调用langchain-chatchat知识库能力
langchin-chatchat部分开发笔记（持续更新）
文心一言、讯飞星火、GPT、通义千问等线上API调用示例
大模型RAG性能提升路径
langchain的基本使用
结合基础模型的大模型多源信息应用开发
COT：大模型的强化利器
多角色大模型问答性能提升策略（附代码）
大模型接入外部在线信息提升应用性能
从零开始的Dify大模型应用开发指南
基于dify开发的多模态大模型应用（附代码）
基于零一万物多模态大模型通过外接数据方案优化图像文字抽取系统
快速接入stable diffusion的文生图能力
多模态大模型通过外接数据方案实现电力智能巡检（设计方案）
大模型prompt实例：知识库信息质量校验模块
基于Dify的LLM-RAG多轮对话需求解决方案（附代码）
Dify大模型开发技巧：约束大模型回答范围
以API形式调用Dify项目应用（附代码）
基于Dify的QA数据集构建（附代码）
Qwen-2-7B和GLM-4-9B：大模型届的比亚迪秦L
文擎毕昇和Dify：大模型开发平台模式对比
Qwen-VL图文多模态大模型微调指南
从零开始的Ollama指南：部署私域大模型
基于Dify的智能分类方案：大模型结合KNN算法（附代码）

需求背景

以政务背景的网上民生为例。
市民需将自己的问题凝炼成标题和文字内容进行上交，政务服务人员需要根据市民上交内容判断负责处理该问题部门进行指派。这实际上是一个分类任务。
该需求的特点如下：
1.分类的内容为自然语言，不似传统AI预测有着明确的特征指标。
2.分类的标准不够清晰，部门之间存在一定的职能重复或问题本身涉及多部门(只是权重不同)。
基于该需求特点，可设计基于大模型和历史案例驱动的指派算法，利用大模型的语义理解和逻辑推理能力，结合历史案例进行指派实现。

解决方案

解决方案：智能案例驱动的指派（Intelligent Case-Driven Dispatch）
提出了智能案例驱动的指派方法。该方法系统应用提示词和思维链技术，并利用大量历史案例动态生成样本指导模型，且无需过分依赖模型推理能力。

提示词：提供角色说明、任务说明、规则说明等，指导LLM完成智能指派任务。
思维链：从现有数据中挑选出经典案例，人工书写推理路径，构成思维链，提供从问题推导出指派机构的完整思考逻辑。
动态少样本生成：通过KNN搜索识别历史案例，对每一个新问题找到它最相关的K个邻居，动态的给出参考案例。

基于Dify的实际开发代码

在这里插入图片描述

首先对问题范围进行限定，并压缩用户输入（过长的token对后续的词嵌入有所影响）。
在这里插入图片描述
历史案例如下所示：

指派参考prompt：

# 角色

- 你是烟台市市民服务热线智能助手。
- 你的任务是参考以往案例分析市民问题应该指派到哪个部门。
# 说明
1. 案例由标题、内容、市民地址、时间、回复部门四部分内容组成。
2. 案例中包含真实的用户问题和回复部门。
3. 案例中描述的地区均属烟台市管辖（也即市教育局、市公安局等指的都是烟台市市直部门，其余区县市部门均属烟台市管辖）。
4. 烟台市现辖5个市辖区，代管6个县级市。市辖区：芝罘区、福山区、牟平区、莱山区、蓬莱区。县级市：龙口市、莱阳市、莱州市、招远市、栖霞市、海阳市。此外，还包括长岛综合试验区、黄渤海新区和高新区。
5. 案例中的回复部门与居民地址高度相关。
6. 仅市直和县级市设有公安局，市辖区无公安局，涉及区级公安局的问题请分配到市直部门**市公安局**。
# 提示
1. 问题中提及具体地区且用户地址也在该地的，会被优先指派到该地区相关的部门回复。
2. 部分问题由于涉及范围、处理难度等因素，会被分配到市直部分。
3. 市民问题中经常提到的开发区实际指的是黄渤海新区。
# 约束
1. 若案例中出现了相同的问题，请优先指定参考案例中的答复机构。
2. 给出的答复机构名称应与案例中的完全相同。
3. 如果从用户问题中仅给出街道、道路、住宅信息，这些信息又跟历史案例无关，请要求用户澄清地址。
4. **重要**：只给出关于**智能指派**的信息，不回答用户的其他问题。
5. **重要**永远不要给出案例中不存在的部门，若没有可供选择的区级部门，请指派给市直单位。
6. 请按照内容简述、问题分析、参考机构的格式依次输出
7. 若无法根据案例推断出市民问题中涉及的道路、小区、学校等所属的具体地址，请优先指派给市直单位。
# 案例
<Case>
{{#context#}}
<Case/>