AI产品经理或者准备从事这个职业的朋友,一定都听说过RAG。RAG全称是Retrieval Augmented Generation,中文意思是检索增强生成,是一种构建AI应用的方法。
RAG是目前AIGC文本生成最普遍、最成熟的应用方法。通俗地理解就是:把知识库提供给大模型,让大模型根据知识库的内容进行回答。
这和用户直接上传一个文档,让大模型根据文档回答问题有一些小的区别。RAG有一个前置流程,即先检索知识库,把检索出来的知识片段提供给大模型,再让大模型根据知识片段回答问题。
这么做的好处是什么呢?总结来说,RAG对AIGC应用的价值有三个方面:
- RAG可以引导大模型回答内容的范围、提升回答质量。
- RAG可以补充大模型在专业领域的知识上的不足,可以让大模型变为行业专家,以及让大模型可以获取最新的知识。
- RAG弥补了大模型处理token长度的限制,对于非常大的知识库,也可以进行检索生成。
给产品经理的通俗理解
-
是什么:RAG 是一个优先使用缓存答案的召回策略。把大模型生成的东东备份下来,每次需要生成内容的时候先看看备份里有没有,如果有就不问大模型了,如果没有才让大模型去生成,并且缓存下来。
-
用来干什么:因为大模型不靠谱,又慢又费钱(更多不靠谱往下看文章)。RAG可以加快召回速度,减少请求大模型的次数。
-
怎么看待大模型:把业务逻辑当主角,把大模型当配角。仅仅只是在需要发散和推理的时候才用得到大模型。
-
重点关注什么:业务逻辑和业务数据,90%的时间应该花在如何获取足够的业务数据,让业务专家方便地确认数据有效性,建立数据保鲜的机制
技术概述
基础:结合检索和生成的技术,通过检索相关信息增强模型的回答。
需求:解决大型模型在知识更新和特定领域知识方面的局限。
核心技术
文本向量化:文本转换为向量,用于相似度计算。
检索增强:检索相关文档片段,结合问题增强回答。
实际应用痛点
文档切分粒度:平衡语义完整性和检索效率。
生成高质量回答:通过Finetune和优化模板提升回答质量。
embedding模型偏差:处理大文本块或多语言时的精准性问题。
优化策略
文档切分:基于语义的切分,提升召回质量。
模型微调:针对特定领域数据进行Finetune。
prompt模板优化:设计更合适的模板引导准确回答。
评测方法
独立评测:分别对检索和生成模块进行评测。
端到端评测:对模型生成的最终响应进行评测。
关键指标和能力
关键指标:答案准确性、相关性、上下文相关性。
关键能力:抗噪声、拒绝无效回答、信息综合、反事实稳健性。
多模态和Self
多模态:处理多种数据格式,如文本和表格,通过多向量检索器实现。
Self:智能实现方式,自我评估输出,根据需要检索信息。
架构优化
知识图谱利用:增强上下文,提供关联知识和增加信息密度。
文档块处理:包括块间重叠、多粒度切分、基于语义的切分等。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!