通过 Page Assist 浏览器插件实现 DeepSeek-R1 RAG(检索增强生成)

上一篇文章中介绍了通过 Ollama 本地部署 DeepSeek-R1 大模型的流程,今天记录一下通过 Page Assist 浏览器插件搭建知识库,实现 DeepSeek-R1 RAG(检索增强生成)。

关于大模型的部署请看:Linux 部署 Ollama + DeepSeek-R1,配置 Page Assist 浏览器插件

前言

         RAG(Retrieval-augmented Generation)检索增强生成,是当下热门的大模型前沿技术之一 。检索增强生成模型结合了语言模型和信息检索技术。具体来说,当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。

        知识库是 RAG 实现高效检索和生成的核心组成部分之一。RAG 通过检索知识库中的信息,增强大语言模型的生成能力,使其能够提供更准确、更可靠的回答。

        RAG 的流程图大致如下:

        在大模型中,Embedding(嵌入)是一种将高维数据映射到低维空间的技术,目的是将离散的、稀疏的数据转换为连续的、密集的向量表示,使得这些数据可以被机器学习或深度学习模型更好地处理和理解。Embedding 通常用于表示文本、图像、图形节点等领域中的元素。

        Embedding 本质上是一种将复杂的对象(如单词、短语、用户、商品等)用一个实数向量来表示的方式,向量中的每个维度对应于该对象的某种潜在特征。这个表示可以捕捉对象之间的相似性或相关性。例如在句子中,man 和 woman、king 和 queen 在“生物”(第一列)的语义上是相似的,但是它们在“性别”(第二列)的语义上是相反的,诸如此类……,嵌入模型会学习到它们的向量在低维空间中的距离。如下所示:

        nomic-embed-text 是 Ollama 平台里最流行的 embedding 模型,是一个基于 Sentence Transformers 库的句子嵌入模型,专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色,特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入,这些嵌入在语义上非常接近,从而在相似度计算和分类任务中表现优异。

一、下载 nomic-embed-text

1、启动 Ollama 服务

systemctl restart ollama.service

2、下载 nomic-embed-text 模型

ollama pull nomic-embed-text

二、准备相关知识库

1、这里我构建了一份【智能客服】的数据

# 智能客服

## 1. 产品基本信息

### 1.1 产品名称
- **商品名称**:华为智能手表 Watch GT 4,运动健康监测,超长续航,蓝牙通话,心率血氧检测,男女通用款

### 1.2 产品价格
- **原价**:¥1299.00
- **促销价**:¥999.00
- **优惠信息**:限时折扣,满¥800减¥50

### 1.3 产品图片
- **主图**:
  - 图片1:手表正面展示(黑色表带)
  - 图片2:手表侧面展示(银色表盘)
  - 图片3:手表佩戴效果图(男女模特)
  - 图片4:功能界面展示(心率监测、运动模式)
  - 图片5:包装盒及配件展示

### 1.4 产品描述
- **核心卖点**:
  - 超长续航:一次充电可使用14天。
  - 健康监测:实时心率、血氧、睡眠监测。
  - 运动模式:支持100+种运动模式,精准记录运动数据。
  - 蓝牙通话:支持蓝牙连接手机接听电话。
  - 时尚设计:1.43英寸AMOLED高清屏,多种表盘可选。

- **适用人群**:
  - 运动爱好者
  - 健康管理人群
  - 商务人士

- **包装清单**:
  - 华为Watch GT 4智能手表 × 1
  - 磁吸充电器 × 1
  - 用户手册 × 1

---

## 2. 规格参数

### 2.1 基本参数
- **品牌**:华为(HUAWEI)
- **型号**:Watch GT 4
- **表盘尺寸**:1.43英寸
- **屏幕类型**:AMOLED高清触摸屏
- **分辨率**:466×466像素
- **表带材质**:氟橡胶(防水防汗)
- **表盘材质**:不锈钢

### 2.2 功能参数
- **健康监测**:
  - 心率监测
  - 血氧检测
  - 睡眠监测
  - 压力监测
- **运动模式**:跑步、骑行、游泳、登山等100+种模式
- **续航时间**:典型使用场景下14天
- **防水等级**:5ATM(50米防水)
- **连接方式**:蓝牙5.2
- **兼容系统**:Android 6.0及以上,iOS 9.0及以上

### 2.3 其他参数
- **重量**:约45g(不含表带)
- **颜色**:黑色、银色、粉色
- **充电时间**:约2小时

---

## 3. 用户评价

### 3.1 好评
- **用户A**:
  - 评分:★★★★★
  - 评价内容:手表颜值很高,功能齐全,续航真的很强,用了10天还有30%的电量,非常满意!
- **用户B**:
  - 评分:★★★★★
  - 评价内容:心率监测很准,运动模式也很实用,游泳时戴着完全没问题,推荐购买!

### 3.2 中评
- **用户C**:
  - 评分:★★★☆☆
  - 评价内容:手表不错,但表带有点硬,戴久了有点不舒服,希望改进。

### 3.3 差评
- **用户D**:
  - 评分:★★☆☆☆
  - 评价内容:蓝牙连接不稳定,偶尔会断开,希望厂家能优化一下。

---

## 4. 常见问题

### 4.1 手表支持微信消息提醒吗?
- 支持,但仅支持查看消息,无法回复。

### 4.2 手表可以接听电话吗?
- 可以,通过蓝牙连接手机后,可以直接在手表上接听电话。

### 4.3 手表防水吗?
- 支持50米防水,可以游泳时佩戴,但不建议在热水浴或桑拿中使用。

### 4.4 手表支持第三方应用吗?
- 支持部分华为生态应用,如支付宝、天气等,但无法安装第三方应用商店的应用。

---

## 5. 售后服务

### 5.1 保修政策
- 全国联保,享受三包服务,质保期为1年。

### 5.2 退换货政策
- 支持7天无理由退换货(需保持商品完好,包装齐全)。

### 5.3 客服联系方式
- 淘宝在线客服:点击右下角“联系客服”
- 官方客服电话:400-830-8300

---

2、将上述样例数据存储为 txt 格式

三、打开 Page Assist 浏览器插件进行配置

1、RAG 设置

2、管理知识

3、管理提示词

4、进入聊天页面,选择提示词和知识库

5、通过对话测试效果,这里我测试了 5 个问题:

(1)华为智能手表 Watch GT 4 的促销价是多少?

(2)这款产品适合什么人群?

(3)用户评价怎么样?

(4)手表支持微信消息提醒吗?

(5)客服电话是多少?

四、总结

        虽然出于测试的目的,本次项目选择了 deepseek-r1:1.5b 这个最小的版本,但通过 RAG 检索增强生成技术,结合知识库和提示词,已经很好的实现了电商【智能客服】的对话场景,其硬件需求、运行速度、推理能力等多方面超乎预期。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值