一文搞懂 RAG 检索增强生成

最新推荐文章于 2024-07-29 11:37:09 发布

musicml

最新推荐文章于 2024-07-29 11:37:09 发布

阅读量516

点赞数 9

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/musicml/article/details/136181106

版权

本文介绍了RAG（检索增强生成）技术，涉及定制知识库、分块、嵌入模型、向量数据库等关键组件，以及其在直播中的应用。此外，还提及了AI大模型的知识图谱和相关开发资源。

摘要由CSDN通过智能技术生成

▼最近直播超级多，预约保你有收获

今晚直播：《大模型应用案例实战》

—1—

RAG 检索增强介绍

检索增强生成（Retrieval Augmented Generation，RAG）是一种强大的工具，它通过将外部知识整合到生成过程中，增强了大型语言模型（LLM）的性能。

让我们探索 RAG 的关键组成部分。

第一、定制知识库

定制知识库是指一系列紧密关联且始终保持更新的信息集合，它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态，也可以表现为一套详尽的文档体系，甚至可能是两者兼具的综合形式。

第二、分块

分块技术是指将大规模的输入文本有策略地拆解为若干个较小、更易管理的片段的过程。这一过程旨在确保所有文本内容均能适应嵌入模型所限定的输入尺寸，同时也有助于显著提升检索效率。

实施一种明智且高效的分块策略，在优化信息处理流程方面具有关键作用，能够极大地增强您的 RAG 系统的性能与响应能力。

第三、Embedding 嵌入 & Embedding Model 嵌入模型

一种将文本数据表示为数值向量的技术，可以输入到机器学习模型中。

嵌入模型负责将文本转换成这些向量。

第四、向量数据库

一系列预先计算的文本数据向量表示，用于快速检索和相似性搜索，具有SQL CRUD 操作、元数据过滤和水平扩展等功能。

第五、用户聊天界面

一个用户友好的界面，允许用户与 RAG 系统互动，提供输入查询并接收输出。

查询转换为嵌入，用于从向量数据库检索相关上下文！

第六、提示模板

为 RAG 系统生成合适提示的过程，可以是用户查询和定制知识库的组合。

这作为输入给 LLM，产生最终回复。

参考引用：https://mp.weixin.qq.com/s/CAcmAOJ6SC7JU80AqAsyuQ

—2—

新年领取《AI 大模型技术知识图谱》

我们梳理了下 AI 大模型的知识图谱，包括12项核心技能：大模型内核架构、大模型开发 API、开发框架、向量数据库、AI 编程、AI Agent、缓存、算力、RAG、大模型微调、大模型预训练、LLMOps 等。

为了帮助同学们掌握 AI 大模型开发技能，我们准备了一系列免费直播干货，扫码全部领取！

END

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

musicml CSDN认证博客专家 CSDN认证企业博客

码龄18年

303: 原创

1万+: 周排名

6571: 总排名

22万+: 访问

: 等级

5321: 积分

1801: 粉丝

2332: 获赞

34: 评论

2620: 收藏

私信

关注

热门文章

最新评论

GraphRAG + Ollama 本地部署全攻略：避坑实战指南
悠哈UHA: 顺带补充，如果用api的话，第二步建立索引就会出问题，改成v1才能成功，不知道为什么
GraphRAG + Ollama 本地部署全攻略：避坑实战指南
悠哈UHA: 我用了api这个接口之后报错 Error embedding chunk {'OpenAIEmbedding': "'NoneType' object is not iterable"}
GraphRAG + Ollama 本地部署全攻略：避坑实战指南
飞鱼逐日: 换个LLM模型试一下，我换了之后就好
GraphRAG + Ollama 本地部署全攻略：避坑实战指南
qudaxiaqudaxia: INFO: Vector Store Args: {} creating llm client with {'api_key': 'REDACTED,len=6', 'type': "openai_chat", 'model': 'llama3:8b', 'max_tokens': 2048, 'temperature': 0.0, 'top_p': 1.0, 'n': 1, 'request_timeout': 180.0, 'api_base': 'http://localhost:11434/v1', 'api_version': None, 'organization': None, 'proxy': None, 'cognitive_services_endpoint': None, 'deployment_name': None, 'model_supports_json': True, 'tokens_per_minute': 0, 'requests_per_minute': 0, 'max_retries': 10, 'max_retry_wait': 10.0, 'sleep_on_rate_limit_recommendation': True, 'concurrent_requests': 1} 然后怎么看到图呢？
GraphRAG + Ollama 本地部署全攻略：避坑实战指南
qudaxiaqudaxia: #查询：python -m graphrag.query --root ./ --method local "who is scrooge, and what are his main relationships?"

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。