公众号:dify实验室
基于LLMOps平台-Dify的一站式学习平台。包含不限于:Dify工作流案例、DSL文件分享、模型接入、Dify交流讨论等各类资源分享。
打造专属AI知识库,只需三步走!
第一步:上传你的知识文档
AI也得“学习”才能变聪明。这第一步,就是把你的企业知识喂给它。
-
收集资料:把你希望AI掌握的知识整理出来。这可以是:
- 产品文档:说明书、规格书、FAQ常见问题解答。
- 内部流程:SOP标准作业程序、规章制度、报销指南。
- 培训材料:新员工手册、技能培训课件。
- 市场报告:行业分析、竞品信息(注意脱敏)。
- 历史记录:重要的项目总结、客户服务案例(同样注意隐私)。
- 格式建议:最好是
.txt
,.md
,.pdf
等文本清晰的格式。Word文档(.docx)也可以,但有时格式转换可能需要注意。
-
登录Dify并创建知识库:
- 打开你的Dify平台(无论是云版本还是私有部署)。
- 在左侧菜单找到“知识库”或类似选项,点击“创建知识库”。
- 给你的知识库起个名字,比如“XX公司内部知识库”。
-
上传文档:
- 进入你刚创建的知识库,选择“上传文档”或“添加数据”。
- 把准备好的文件拖拽进去或者选择文件上传。
- 关键点:Dify会对文档进行分段和清洗。你可以选择自动处理,或者根据需要调整分段长度、重叠等参数,这会影响后续AI检索的效果。数据质量是AI效果的基石,上传前尽量保证文档内容清晰、结构化。
第二步:配置与索引
上传完文档,Dify就要开始“消化吸收”了。
-
文本向量化:
- 简单理解,就是Dify调用一个Embedding模型,把你的文档内容转化成AI能理解的向量。这样AI就能判断哪些文档片段在意思上是相关的。
- 在Dify里,这个过程通常在你上传文档后自动开始。你可以在知识库设置里选择不同的Embedding模型(如果平台提供选项),不同的模型在处理中文、处理特定领域知识上效果可能不同,可以根据实际测试选择。
-
建立索引:
- 就像给书建目录一样,Dify会为这些向量建立索引,方便AI快速查找。
- 这个过程也是后台自动完成的。文档越多越大,需要的时间越长。你可以在知识库状态里看到处理进度。耐心等待它完成。
-
选择检索策略:
Dify允许配置AI如何在知识库里找答案,比如是只找最相关的几段,还是结合关键词搜索等。初期使用默认设置即可。
这一步的核心就是让Dify把你的静态文档变成AI可以检索、理解的动态知识。大部分工作Dify都帮你自动化了,你要做的就是确保文档上传成功,并等待处理完成。
第三步:创建AI应用并连接知识库
知识库建好了,怎么用起来呢?我们需要创建一个AI应用(比如问答机器人)来调用它。
-
创建AI应用:
- 在Dify左侧菜单,选择“应用”或类似功能,点击“创建应用”。
- 选择应用类型,最常用的就是“对话型”或“问答型”应用。
- 给你的应用起个名字,比如“公司产品万事通”、“内部流程小助手”。
-
配置应用核心 - Prompt:
- 这是告诉AI“你是谁”、“你要做什么”、“怎么做”的地方。
- 关键一步:在应用的配置界面(通常在“提示词(Prompt)”或“上下文(Context)”设置里),找到关联知识库的选项。
- 选择你刚才创建的那个知识库。
- 编写指令(System Prompt):明确告诉AI,它的回答要基于你提供的知识库。例如:
你是一个XX公司的内部知识助手。请根据我提供的知识库文档来回答问题。如果知识库没有相关信息,请明确说明,不要自行编造。
严格依据知识库内容回答关于产品功能的问题,保持回答简洁准确。
-
选择大模型(LLM):
为你的应用选择一个负责“思考和说话”的大模型。可以是 GPT系列、Claude系列,或者国内的文心一言、通义千问等(取决于你的Dify平台接入了哪些)。考虑成本、速度和回答质量来选择。 -
测试与发布:
- 在Dify应用界面通常都有一个调试预览窗口。在这里输入问题,测试AI是否能根据你的知识库正确回答。
- 反复测试:问各种你想到的问题,特别是边界情况、模糊问题,看看AI的反应。
- 根据测试结果,回去优化Prompt,或者检查知识库文档是否有遗漏或错误。
- 满意后,你可以通过Dify提供的API接口,将这个AI应用集成到你的网站、钉钉、企业微信、内部App等地方,让员工方便使用。
实操小贴士(让你的AI知识库更好用)
- 持续迭代:知识库不是一次建成就万事大吉的。定期更新文档,补充新知识,淘汰旧信息。
- 关注数据质量:垃圾进,垃圾出。上传前检查文档的准确性、清晰度。结构化的文档(如FAQ)比大段的散文效果更好。
- 用户反馈:鼓励员工使用并提供反馈,了解哪些问题答得不好,是知识库缺内容,还是Prompt指令不清晰?
- 从小处着手:可以先从某个部门或某个具体业务场景(如HR政策问答、IT帮助台)开始试点,成功后再推广。
- 安全第一:如果是处理敏感信息,务必优先考虑私有化部署Dify,并做好权限管理。
关注我可领DSL文件及token福利
往期工作流文章
10分钟构建基于 Dify 的智能文章仿写工作流:配置指南,效率飙升300%!
20分钟从零到一构建Dify智能客服工作流教程(附DSL文件下载)
更多工作流案例,请到公众号主页查看
dify相关资源
如果对你有帮助,欢迎点赞收藏备用。
回复 DSL 获取公众号DSL文件资源
回复 入群 获取二维码,我拉你入群
回复 tk 获取免费token资源
你又不打算赞赏,就点赞、在看吧。