构建一个以RAG技术为核心功能的基于自建知识库的本地大模型（二）环境搭建篇

YQQ学习日记

已于 2024-08-05 16:54:24 修改

阅读量787

点赞数 19

分类专栏：大模型文章标签： python langchain

于 2024-07-29 10:44:38 首次发布

本文链接：https://blog.csdn.net/YQQ_0424/article/details/140725362

版权

提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、框架分工
二、Langchain下载
三、Ollama下载
四、Chroma向量数据库使用
五、千帆大模型平台使用
总结

前言

随着人工智能的不断发展，大语言模型这门技术也越来越重要，很多人和企业都开始将大语言模型投入生产之中。本文开始将介绍基于自建知识库的本地大模型的具体实现方式。博主搭建了一个基于Langchain、Ollama、Chroma矢量数据库以及千帆大模型平台的框架示例。

提示：以下是本篇文章正文内容，下面案例可供参考

一、框架分工

利用Langchain库构建AI组件，负责处理自然语言理解和生成任务。
集成Ollama作为基础的聊天机器人框架，提供用户界面和交互逻辑。
使用Chroma矢量数据库存储与检索知识或上下文信息。这为自建知识库提供了储存空间并且有助于机器人在对话中保持连贯性，理解并记忆多次会话中的相关信息。
通过千帆大模型平台进行大模型微调，提高大模型效率。

二、Langchain下载

前提：你已经有python开发系统

#在终端中
pip install langchain
pip install langchain-community
pip install langchain

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YQQ学习日记

关注关注

19
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【DeepSeek R1构建本地RAG知识库】Embedding模型原理详解

少说，多做

04-04

157

当我们利用检索增强生成（RAG）技术构建本地知识库时，Embedding模型就像是这个知识宝库的智能化导航系统，它能够帮助我们迅速且精准地定位到所需的信息。对于刚刚涉足这一领域的初学者而言，可能会对Embedding模型的本质及其在本地知识库中的功能感到困惑。近期关于本地知识库的课程中，不少学习者也表达了相似的疑问。接下来，我们将采用简单明了的语言，并结合实际案例，深入讨论这些问题，同时也会介绍如何整理本地的知识素材，以便让基于本地RAG的问题回答变得更加精确和全面。

从零搭建基于langchain的本地大模型+本地向量数据库的RAG系统

liupras的博客

10-03

614

这是从零开始搭建langchain本地化RAG服务（本地部署的lamma3.1+本地部署的chroma）的保姆级教程

参与评论您还未登录，请先登录后发表或查看评论

LangChain 0.2 - 构建本地 RAG应用

AI工程化、开源分享、文档翻译、代码笔记

05-29

976

一、项目说明二、文档加载三、模型 1、LLaMA2 2、GPT4All 3、llamafile 四、链式使用五、问答六、检索问答

本地离线模型搭建指南-RAG架构实现

Master_Shifu_的博客

06-23

2234

检索增强生成（Retrieval Augmented Generation, RAG）是当前最热门的大语言模型（LLM）应用方案之一。RAG结合了信息检索和生成模型的优势，旨在增强生成式模型的知识覆盖和输出准确性。

langchain框架轻松实现本地RAG

qyhua的专栏

07-04

2554

RAG（Retrieval-Augmented Generation）是一种结合了检索和生成模型的方法，主要用于解决序列到序列的任务，如问答、对话系统、文本摘要等。它的核心思想是通过从大量文档中检索相关信息，然后利用这些信息来增强生成模型的输出。

本地大模型部署和基于RAG方案的私有知识库搭建

youmaob的博客

07-24

2069

以上就是本地大模型部署和基于RAG方案的私有知识库搭建的基本操作。除此之外，还有更多丰富有趣的功能等待探索。如今大模型遍布各行各业、各个领域，基于RAG方案的私有知识库技术也逐渐发展，成为提升个人工作效率与创造潜能的新风尚。本地部署模型意味着用户能在自己的设备上享受即时响应的智能辅助，无需依赖云端，既保护了个人数据隐私，又确保了操作的低延迟与高可靠性。结合RAG方案的私有知识库，则让每位用户能够构建专属自己的知识宇宙。

构建一个以RAG技术为核心功能的基于自建知识库的本地大模型（一）理论知识篇

YQQ_0424的博客

07-26

1559

本文就将从理论知识介绍了如何构建一个以RAG技术为核心功能的基于自建知识库的本地大模型，并提供一些思路

RAG-基于本地知识库检索+LLM微调的智能问答系统实现-附项目源码-优质项目实战.zip

09-03

在智能问答系统中，RAG模型（Retrieval-Augmented Generation）是一种结合了检索和生成的模型，它首先从一个预先定义好的知识库中检索出相关的信息，然后利用预训练的语言模型（LLM）生成最终的答案。在本文中，...

利用大模型技术，打造本地个人专属知识库

晨曦蜗牛

06-27

2548

预训练的大型语言模型已经成为推动自然语言处理领域进步的关键力量。这些模型凭借其强大的语境理解、生成和交互能力，在信息检索、知识管理、创意辅助等多个领域展现出巨大潜力。然而，当前大多数应用依赖于云端服务，用户数据需上传至远程服务器进行处理，这不仅涉及隐私安全问题，也对网络环境有较高要求。鉴于此，利用主流开源大模型技术，构建一套运行于本地环境的个人专属知识库系统，整合个人积累资源，实现知识的高效管理、个性化学习与创作辅助，同时保障用户数据的私密性与安全性与充分应用本地计算资源。

如何手撸一个自有知识库的RAG系统

python1234567_的博客

06-20

1024

RAG通常指的是"Retrieval-Augmented Generation"，即“检索增强的生成”。这是一种结合了检索（Retrieval）和生成（Generation）的机器学习模型，通常用于自然语言处理任务，如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统。

RAG 入门指南：从零开始构建一个 RAG 系统

mama19971023的博客

08-05

1995

在开始之前，我还是打算再次简要的介绍一下 RAG。在 Meta 的官方 Blog 上有这样一段话：这段话主要讲述了一个新的模型架构，也就是RAG (检索增强生成)的重要性和优势。可以概括为以下几点：1. 构建一个能够进行研究和上下文分析的模型虽然更具挑战性，但对未来的技术进步非常关键；2. 通过在知识密集的下游任务上微调，RAG 可以实现最先进的结果，比现有的最大的预训练序列到序列语言模型还要好；3. 与传统的预训练模型不同，RAG 的内部知识可以轻松地动态更改或补充。

LLM之使用ollma本地搭建RAG系统

weixin_44598554的博客

07-29

692

我的是 ollama pull gemma2 或者 ollama pull qwen2:0.5b。选择一个down下来：ollama pull mxbai-embed-large。随后再输入 ollama serve，开启ollama。官网有介绍不同操作系统的下载方式。ollama的LLM模型选一个。然后输入ollama。

构建本地知识库(下)：使用RAG构建知识库

2401_84204413的博客

08-14

1373

本章中，我们回归了一下RAG的流程，并分析了下这个过程中涉及到的组件以及这些组件在langchain中对应的实现方式，并整合这些方式，实现了带RAG的大模型应用。通过这个实践过程，能够帮助我们更好的理解RAG的整个过程。（当然为了演示，我们这里实现的是最基础的RAG）。在本篇文章内容中，除了RAG技术外，还涉及到两个知识内容：python和langchain,没有相关背景的同学可能会对涉及到这两个内容的地方会有些困惑。但没有关系，我也不熟，并且在这篇文章中这并不影响我们理解RAG的整个过程。

三分钟搭建线上RAG应用，实现定制化的知识库问答

python123456_的博客

07-25

1512

由于大模型API价格已成白菜价，AI应用的开发将进入到RAG时代，而由于有了像阿里云百炼这样的一站式平台，普通开发者也能开发定制化的AI SaaS应用。遥想2023年的3月份，GPT-4的32k上下文的API价格是平均每千字就超过0.5元，如果是加上历史对话，简单的一个问题都要好几块钱。由于价格太贵，很多应用的开发都只停留在简单的对话上，而现在各种大模型成本的降低，才让RAG应用开发成了可能。

在windows 11本地搭建RAG数据查询的AI大模型环境

ainnle的专栏

05-01

4663

其中，基于检索-生成器（Retrieval-Augmented Generation，简称RAG）架构的数据查询模型备受关注，因为它能够结合从大规模文本语料库中检索信息和生成自然语言文本的能力，实现更加智能和准确的数据查询。1. 下载 Docker Desktop：首先，打开浏览器，访问 Docker 官方网站（https://www.docker.com/products/docker-desktop），在该页面上找到适用于 Windows 的 Docker Desktop 安装程序，并点击下载。

从零开始学 langchain 之搭建最小的 RAG 系统

AAI666666的博客

04-22

2638

RAG 可以说是 23 年以来到现在，最为火热的大模型应用技术了，很多人都有了很多经典的研究。而对于新人来说，有些代码十分复杂，导致只看表象并不理解其原理。今天，就利用 langchain 和大家一起搭建一个最简单的 RAG 系统，一起来学习一下吧。

手把手教你实现RAG

u012854516的专栏

03-13

3459

这样切分出来的文档片段就是一个一个的差不多相同长度的文档片段了。不过在切分的时候要注意，片段与片段之间最好要有一些重叠的内容，这样才能保证检索的时候能够检索到相关的文档片段。LLM会产生误导性的 “幻觉”，依赖的信息可能过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。基类，这样我们再用其他的模型的时候，只需要继承这个基类，然后在此基础上进行修改即可，方便代码扩展。一样的，我们还是先实现一个基类，这样我们在遇到其他的自己感兴趣的模型就可以快速的扩展了。

Chroma + Ollama 搭建本地RAG应用

奇舞周刊

06-04

1443

> 本文作者为 360 奇舞团前端开发工程师本篇文章我们将基于Ollama本地运行大语言模型（LLM），并结合ChormaDB、Langchain来建立一个小型的基于网页内容进行本地问答的RAG应用。概念介绍先简单了解下这些术语：LLM (A large language model) 是通过使用海量的文本数据集（书籍、网站等）训练出来的，具备通用语言理解和生成的能力。虽然它可以推理许多内容...

基于deepseek搭建rag公司知识库的大模型