【LLM】五、open-webui+ollama搭建自己的RAG服务

~啥也不会~

已于 2025-02-14 19:19:25 修改

阅读量1.7w

点赞数 34

文章标签： chatgpt AIGC gpt llama langchain gpt-3

于 2024-07-31 11:02:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_55068938/article/details/140526935

版权

系列文章目录

往期文章回顾：

【LLM】四、RAG简介

【LLM】三、open-webui+ollama搭建自己的聊天机器人

【LLM】二、python调用本地的ollama部署的大模型

【LLM】一、利用ollama本地部署大模型

文章目录

目录

系列文章目录

一、RAG是什么

二、搭建自己的RAG服务

1.准备自己的知识库文件

2.open-webui 前期准备工作

3.导入知识库并写入向量库

4.搭建并使用自己的RAG服务

三、扩展知识

2.向量数据库

前言

往期文章中，已经讲解了如何用ollama部署本地模型，并通过open-webui来部署自己的聊天机器人，同时也简单介绍了RAG的工作流程，本篇文章将会基于之前的内容来搭建自己的RAG服务，正文开始。

一、RAG是什么

RAG的相关简介可以去“系列文章四” 中查看，这里不在赘述

二、搭建自己的RAG服务

1.准备自己的知识库文件

常见的文档格式一般为txt、doc、PDF等，这里我将选择最简单的txt文档进行导入，需要注意以下几点：

由于目前LLM均有token的限制，所以在写入向量库时会对我们上传的文档进行分割、切块，将较长的文本切分成较小的文本，每段文本即为一个单位的知识。
当PDF、doc中设计到表格、图片时，需要特殊处理，现有框架如open-webui或者lang chain等在加载该类文档时，仅仅会处理文字部分，图片和表格部分均会忽略，如果图片内容对你来说也非常重要的话，需要自己转换下，如OCR识别或者WPS转换（效果针对与具体文档而言，这里不给评价）

这里，我以一个最简单的txt来作为参考，为了方便演示，内容相对简单且简洁，具体如下：

</

最低0.47元/天解锁文章

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。