上一篇文章中介绍了通过 Ollama 本地部署 DeepSeek-R1 大模型的流程,今天记录一下通过 Page Assist 浏览器插件搭建知识库,实现 DeepSeek-R1 RAG(检索增强生成)。
关于大模型的部署请看:Linux 部署 Ollama + DeepSeek-R1,配置 Page Assist 浏览器插件
前言
RAG(Retrieval-augmented Generation)检索增强生成,是当下热门的大模型前沿技术之一 。检索增强生成模型结合了语言模型和信息检索技术。具体来说,当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。
知识库是 RAG 实现高效检索和生成的核心组成部分之一。RAG 通过检索知识库中的信息,增强大语言模型的生成能力,使其能够提供更准确、更可靠的回答。
RAG 的流程图大致如下:
在大模型中,Embedding(嵌入)是一种将高维数据映射到低维空间的技术,目的是将离散的、稀疏的数据转换为连续的、密集的向量表示,使得这些数据可以被机器学习或深度学习模型更好地处理和理解。Embedding 通常用于表示文本、图像、图形节点等领域中的元素。
Embedding 本质上是一种将复杂的对象(如单词、短语、用户、商品等)用一个实数向量来表示的方式,向量中的每个维度对应于该对象的某种潜在特征。这个表示可以捕捉对象之间的相似性或相关性。例如在句子中,man 和 woman、king 和 queen 在“生物”(第一列)的语义上是相似的,但是它们在“性别”(第二列)的语义上是相反的,诸如此类……,嵌入模型会学习到它们的向量在低维空间中的距离。如下所示:
nomic-embed-text 是 Ollama 平台里最流行的 embedding 模型,是一个基于 Sentence Transformers 库的句子嵌入模型,专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色,特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入,这些嵌入在语义上非常接近,从而在相似度计算和分类任务中表现优异。
一、下载 nomic-embed-text
1、启动 Ollama 服务
systemctl restart ollama.service
2、下载 nomic-embed-text 模型
ollama pull nomic-embed-text
二、准备相关知识库
1、这里我构建了一份【智能客服】的数据
# 智能客服
## 1. 产品基本信息
### 1.1 产品名称
- **商品名称**:华为智能手表 Watch GT 4,运动健康监测,超长续航,蓝牙通话,心率血氧检测,男女通用款
### 1.2 产品价格
- **原价**:¥1299.00
- **促销价**:¥999.00
- **优惠信息**:限时折扣,满¥800减¥50
### 1.3 产品图片
- **主图**:
- 图片1:手表正面展示(黑色表带)
- 图片2:手表侧面展示(银色表盘)
- 图片3:手表佩戴效果图(男女模特)
- 图片4:功能界面展示(心率监测、运动模式)
- 图片5:包装盒及配件展示
### 1.4 产品描述
- **核心卖点**:
- 超长续航:一次充电可使用14天。
- 健康监测:实时心率、血氧、睡眠监测。
- 运动模式:支持100+种运动模式,精准记录运动数据。
- 蓝牙通话:支持蓝牙连接手机接听电话。
- 时尚设计:1.43英寸AMOLED高清屏,多种表盘可选。
- **适用人群**:
- 运动爱好者
- 健康管理人群
- 商务人士
- **包装清单**:
- 华为Watch GT 4智能手表 × 1
- 磁吸充电器 × 1
- 用户手册 × 1
---
## 2. 规格参数
### 2.1 基本参数
- **品牌**:华为(HUAWEI)
- **型号**:Watch GT 4
- **表盘尺寸**:1.43英寸
- **屏幕类型**:AMOLED高清触摸屏
- **分辨率**:466×466像素
- **表带材质**:氟橡胶(防水防汗)
- **表盘材质**:不锈钢
### 2.2 功能参数
- **健康监测**:
- 心率监测
- 血氧检测
- 睡眠监测
- 压力监测
- **运动模式**:跑步、骑行、游泳、登山等100+种模式
- **续航时间**:典型使用场景下14天
- **防水等级**:5ATM(50米防水)
- **连接方式**:蓝牙5.2
- **兼容系统**:Android 6.0及以上,iOS 9.0及以上
### 2.3 其他参数
- **重量**:约45g(不含表带)
- **颜色**:黑色、银色、粉色
- **充电时间**:约2小时
---
## 3. 用户评价
### 3.1 好评
- **用户A**:
- 评分:★★★★★
- 评价内容:手表颜值很高,功能齐全,续航真的很强,用了10天还有30%的电量,非常满意!
- **用户B**:
- 评分:★★★★★
- 评价内容:心率监测很准,运动模式也很实用,游泳时戴着完全没问题,推荐购买!
### 3.2 中评
- **用户C**:
- 评分:★★★☆☆
- 评价内容:手表不错,但表带有点硬,戴久了有点不舒服,希望改进。
### 3.3 差评
- **用户D**:
- 评分:★★☆☆☆
- 评价内容:蓝牙连接不稳定,偶尔会断开,希望厂家能优化一下。
---
## 4. 常见问题
### 4.1 手表支持微信消息提醒吗?
- 支持,但仅支持查看消息,无法回复。
### 4.2 手表可以接听电话吗?
- 可以,通过蓝牙连接手机后,可以直接在手表上接听电话。
### 4.3 手表防水吗?
- 支持50米防水,可以游泳时佩戴,但不建议在热水浴或桑拿中使用。
### 4.4 手表支持第三方应用吗?
- 支持部分华为生态应用,如支付宝、天气等,但无法安装第三方应用商店的应用。
---
## 5. 售后服务
### 5.1 保修政策
- 全国联保,享受三包服务,质保期为1年。
### 5.2 退换货政策
- 支持7天无理由退换货(需保持商品完好,包装齐全)。
### 5.3 客服联系方式
- 淘宝在线客服:点击右下角“联系客服”
- 官方客服电话:400-830-8300
---
2、将上述样例数据存储为 txt 格式
三、打开 Page Assist 浏览器插件进行配置
1、RAG 设置
2、管理知识
3、管理提示词
4、进入聊天页面,选择提示词和知识库
5、通过对话测试效果,这里我测试了 5 个问题:
(1)华为智能手表 Watch GT 4 的促销价是多少?
(2)这款产品适合什么人群?
(3)用户评价怎么样?
(4)手表支持微信消息提醒吗?
(5)客服电话是多少?
四、总结
虽然出于测试的目的,本次项目选择了 deepseek-r1:1.5b 这个最小的版本,但通过 RAG 检索增强生成技术,结合知识库和提示词,已经很好的实现了电商【智能客服】的对话场景,其硬件需求、运行速度、推理能力等多方面超乎预期。