轻松搭建本地大语言模型(五)Dify知识库:本地大语言模型弹药库(deepseek、llama、qwen)

引言

为什么要使用知识库?

(1)补充模型的局限性

在未联网的情况下,大语言模型虽然经过海量数据的训练,但其知识是静态的,通常停留在训练数据的截止日期之前。对于最新的事件、行业动态或小众领域的专业知识,模型无法提供准确的信息,通过引入本地部署的知识库,我们可以为模型提供最新的、特定领域的知识,从而弥补其知识的空白,确保在未联网环境中也能获取准确和有用的信息。

(2)提升准确性和可靠性

知识库中的信息经过精心整理和验证,能够为模型提供高质量的知识支持。当模型在生成回答时,可以参考知识库中的准确信息,避免因自身的不确定性和偏差而产生错误。例如,在医疗、法律等专业领域,准确的知识库能够确保模型生成的内容符合行业标准,减少误导性信息的传播。

(3)增强模型的个性化能力

不同的应用场景和用户群体对知识的需求各不相同。通过定制化的知识库,我们可以为模型注入特定领域的知识,使其更好地适应特定用户的需求。比如,一个面向金融行业的聊天机器人可以使用包含金融市场数据和法规的知识库,从而为用户提供更精准的服务。

基于以上的原因,我们就引入了今天的目标,通过设置知识库,让大语言模型能够根据知识库回答问题。

目标

基于dify知识库功能实现大模型根据知识库回答问题。
效果如下:
image-20250220223757818

环境要求

  • dify运行环境
  • ollama环境(非必选,可以用其他模型供应商代替)

可参考以下文章搭建:

轻松搭建本地大语言模型(一)Ollama安装与使用
轻松搭建本地大语言模型(四)Dify 对接 Ollama:让本地大模型变得触手可及

一、创建一个聊天助手

image-20250220214643006

选择聊天助手,填写应用名称

image-20250220214726575

二、测试聊天

image-20250220215723579

可以看到,查询只有影子是谁,并不能返回啥信息,所以我们就要进行下一步,创建知识库并与聊天助手关联。

三、创建知识库并导入文件

(1)创建知识库

image-20250220220406093

image-20250220220428945

(2)导入现有的知识文件

支持 TXT、 MARKDOWN、 MDX、 PDF、 HTML、 XLSX、 XLS、 DOCX、 CSV、 MD、 HTM格式。

我这里只是演示,就导入一个简单的txt

文件内容:

image-20250220220530580
导入
image-20250220220609732

(3)设置Embedding模型

这里可能会遇到一个问题,没有Embedding模型(Embedding模型为空或报错)。

image-20250220222851166

我们就需要设置Embedding模型

Embedding模型是一种将文本转换为向量表示的技术。它能够将文本中的语义信息编码为高维向量,使得语义相似的文本在向量空间中距离更近。这种向量化的表示方式为后续的语义检索和知识匹配提供了基础。

拉取Embedding模型

使用ollama执行以下命令

ollama pull bge-m3

image-20250220222937497

这里使用了bge-m3,更多Embedding模型选择

地址: https://ollama.com/search?c=embedding&q=bge

image-20250220222507372

添加Embedding模型

模型拉取成功后,点击右上角设置,在模型供应商中添加模型

image-20250220223052039

image-20250220223312848

添加成功后,刷新界面,重新导入文件就可以选择Embedding模型了

image-20250220223556177

(4)保存配置

image-20250220223631309

直接点保存并处理,即可使用

等待一小会后,这里就嵌入完成了

image-20250220221026632

四、聊天助手关联知识库

回到聊天助手配置界面,在界面挂接知识库

image-20250220221202770

image-20250220221252075

接着问刚才提问的问题,他就可以根据知识库的内容回复问题了

image-20250220223757818

总结

本文主要介绍了如何使用Dify知识库功能实现本地大语言模型基于知识库回答问题,并详细阐述了创建聊天助手、测试聊天、创建知识库、导入文件、设置Embedding模型以及关联知识库等操作步骤。通过这些步骤,用户可以实现大模型根据知识库回答问题,从而弥补模型在离线场景下的知识局限性,提升其准确性和个性化能力。

参考资料

dify官方知识库介绍

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丶只有影子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值