第四节:RAGFlow本地知识库搭建与配置

一、说明

  1. 本章节介绍利用RAGFlow配置本地部署的DeepSeek
  2. 老样子, 无废话, 直接开干
  3. 基于《第三节:RAGFlow基于本地部署的DeepSeek模型简单配置》进行操作

二、开始配置文档库

  1. 老样子,登录系统进入主界面

image-20250318094947892

  1. 知识库文档准备
    • 根据上一章节, 将基本的deepseek 70b已经配置好
    • 此处准备做一个公安系统犯罪嫌疑人记录知识库, 提前准备三份犯罪嫌疑人档案, 目录和文件结构如下
❯ ll -a
-rw-r--r--@  1 xincan  staff    10K  3 14 14:26 犯罪嫌疑人-1.xlsx
-rw-r--r--@  1 xincan  staff    10K  3 13 17:26 犯罪嫌疑人-2.xlsx
-rw-r--r--@  1 xincan  staff    10K  3 13 21:05 犯罪嫌疑人-3.xlsx
  • 文件信息

image-20250422134832671

  1. 知识库构建
    • 点击知识库构建

image-20250422135824358

  • 这里知识库名称是创建时携带过来的
  • 也可以给知识库上传图片
  • 添加描述
  • 权限分配
  • 文档解析器默认DeepDoc
  • 嵌入模型选BAAI/bge-large-en-v1.5

image-20250422135935627

  • 切片方法选择General
  • 分段标识符不变
  • 其它都不改变, 先默认

image-20250422135958135

image-20250422140015933

  1. 点击保存跳转到数据集

image-20250422140102822

  1. 上传上述准备好的文档
    • 勾选创建时解析文档, 此步骤是利用本身自带的BAA/bge-large-en-v1.5模型进行解析, 存入到向量数据库, 我在安装ragflow时, 安装的是权量完整版的, 自带内嵌解析模型

image-20250422140215581

  1. 点击确定, 等待解析完成

image-20250422140246086

  1. 解析成功
    • 此处如果上个步骤没有勾选创建时解析, 点击刷新按钮进行解析, 确保解析状态为成功, 同时开启启用

image-20250422140913834

三、聊天配置

  1. 点击聊天, 新建助理
    • 助理名称:犯罪信息
    • 助理描述: 犯罪助理
    • 助理头像: 你喜欢的头像
    • 知识库选择刚才创建的: 犯罪嫌疑知识库
    • 其它保持不变

image-20250422141613005

  1. 保存确定, 点击加号, 新增聊天信息
    • 聊天内容: 请问犯罪嫌疑人信息: 姓名、身份证、年龄三个方面, 表格展示
    • 此时开始思考, 并从知识库中开始分析
    • 最终根据我的描述将犯罪嫌疑人的基础信息以表格的形式展现, 并给出引用
    • 同时, 文档中没有给出犯罪嫌疑人的年龄, 此时年龄是基于2023年计算的, 这个有问题, 后续解决
    • 基本上算是完成了我想要的本地知识库检索的这么个东西

image-20250422142217651

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值