【LLM大模型】RAG技术要点及英智未来的应用实践

RAG是检索增强生成(Retrieval-augmented Generation),概念是在2020年发表的论文《面向知识密集型NLP任务的检索增强生成》中提出的。

LLM的工作原理是基于预训练的历史数据进行推理生成文本,所以LLM在生成回答的时候可能会引入了过期的、不可预测的或者错误的信息,导致大语言模型(LLM)在生成回答时可能产生的不准确或具误导性的输出,这种导致LLM生成毫无意义的或者错误的内容,称为AI幻觉。

RAG利用向量相似度检索技术搜索文档,然后组合成prompt喂给大模型,大模型再生成最终的答案,能有效的解决AI幻觉问题和知识更新等问题。

据调查统计,目前超过80%的落地应用基本都是RAG。

在这里插入图片描述

RAG工作原理

做好RAG要经过数据提取、数据索引、检索、生成四个阶段,每个阶段都有不少难点。先用一张简单的图给大家看下RAG的过程:在这里插入图片描述

1. 首先是数据提取

这一步的核心是要把各种结构化,非结构化数据能提取出来,用于后面的处理。这里的复杂度主要是:

  • 文件格式复杂,以pdf为例子,不光有文字,还夹杂有图表,图片里面又有文字。
  • 文件有上下文,要把上文相关的元信息提取出来,后面就更容易处理。如果不提取元信息,那下一步数据分块,就容易切分错误。

2. 其次数据索引

这一步做好文档的切分, embedding模型,把文件embedding成向量,才可以把向量存到向量数据库里面去。这里的难点又有两个:

  • 数据切分,过大、或过小都会有问题。所以一般是按照300~400个字节切分。还有处理更精细的,是按意图切分。
  • 另外就是embedding模型,文本类的有BGE、openAI的text-embedding-3;文图关联的有CLIP。现在这块的多模态模型是下一步重点。

3. 然后就是检索

检索主要分query预处理、召回两个步骤:

  • query预处理主要的步骤是意图识别、同义词生成、专有名词生成等。
  • 召回主要就是向量数据库的工作,要支持向量检索、文本检索、多路召回能力、召回之后重排技术。

4. 最后是生成阶段

检索出来的结果在给大模型之前,还要prompt优化,包括prompt加上step by step、针对场景的加上相应的提示词等。最后的结果依赖大模型的理解、生成、逻辑推理能力,大模型能力的强弱也直接决定RAG的效果。

RAG应用场景

  • 通用问答系统:RAG可以根据检索到的相关信息生成准确的答案,帮助员工更快地获取所需信息,提高决策效率,这些答案可能不直接包含在训练数据中,如公司规章制度、新员工入职培训、公司合同资料解读和查询等。

  • 智能客服系统:RAG可以结合产品资料知识库、聊天记录、用户反馈等数据,自动为用户提供更精准的回答。

  • 自动化文档处理:企业可以利用RAG和LLM自动化文档处理流程,例如自动生成合同、报告或策略文件,节省时间和人力成本。

  • 数据分析和处理:LLM和RAG可以结合外部数据源,如数据库、API、文件等,为数据处理和分析提供更丰富的信息。

RAG工作实践

英智「智能宝」是一款结合LLM+RAG技术的企业级AI智能体,通过私有化部署和分级权限管控确保信息安全边界、实时关联企业内部数据提供精准信息服务、面向企业业务场景深度定制办公助理智能体,助力企业打造AI时代的新质生产力!

优势一:数据安全边界

私有化部署,企业内部数据不出组织边界,有效防止企业隐私泄漏的风险。

优势二:分级权限管理

高度定制化的访问控制,分角色、分权限、分部门授权,企业内部员工之间也可做到数据隔离,确保内部敏感信息的安全。

优势三:内容关联性

在大模型的通用智能能力之上,结合经过授权的企业内部知识和实时数据,为企业员工提供更精准、更有针对性的信息。

优势四:场景化数字助理

深挖行业属性和应用场景,集成为AI智能体的能力,与企业员工协同工作,无缝衔接企业现有工作模式,提高工作效率和质量。

优势五:与ChatGPT同等智能水平

支持Llama3、Gemma、Qwen、Baichuan、GLM等业内主流大模型,采用领先的vLLM推理引擎,可插拔式更换大模型,确保智能水平和最前沿的AI技术保持同步。在这里插入图片描述

英智AI智能体通过内置的高质量行业大模型,能够为企业结合自身数据快速创建定制化模型,满足企业特定商业场景需求,为教育、金融、法律等各行各业提供了大模型解决方案。比如:

  • 在教育行业,英智AI智能体可以辅助教师制作教学物料、协助教师优化教学方法、为学生定制个性化的学习路径、提供学生实时反馈与互动等;
  • 在金融行业,英智AI智能体可以为金融客户提供专业咨询服务、帮助投资人员分析投资决策、帮助金融机构提供风险评估预测、自动化生成分析报告等;
  • 在法律行业,英智AI智能体可以协助撰写各类专业的文书、帮助理解和分析案件等。

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

  • 8
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值