RAG常见七大坑

论文题目:《Seven Failure Points When Engineering a Retrieval Augmented Generation System》 

论文地址:https://arxiv.org/pdf/2401.05856.pdf

LLM局限

        在面临以下情况时LLM存在局限性:最新知识或者是频繁更新的知识;2.领域相关知识。

RAG的作用

        1.减少LLM的幻觉问题     

        2.链接 资源/参考 来生成回复

        3.消除使用元数据注释文档的需要

RAG组成

        检索组件:从数据存储中检索与查询相关信息

        生成组件:使用检索到的信息作为相关上下文为用户查询生成答案

        LLM作用:检索器、数据生成、重写器和阅读器

案例研究

        认知审稿人/AI教程/生物医学问答

RAG七大坑

        1.内容缺失:检索内容与查询内容相关但无法回复时出错

        2.遗漏排名靠前文档:答案在文档中,但文档的排名不够高

        3.不在上下文:合并策略限制,检索到了答案相关文档,但没有合并进上下文

        4.没有提取到:相关文档太多噪声和矛盾,LLM不能正常回答

        5.格式错误:问题涉及特定格式,LLM忽略指令

        6.不正确特征:答案过于具体或笼统

        7.答案不完整:信息遗漏,答案在相关文档中没有被LLM完整提取

RAG关键因素(研究方向)

        1.分块和嵌入:

                分块可以分为基于启发和基于语义;

                权衡方法,查询相关性、检索准确性作为指标;

                多媒体和多模块的嵌入

        2.RAG v.s. 微调:RAG对于微调的优势:更新相关文档,控制用户访问文档权限

        3.测试/监控RAG系统:构建逼真的领域问答

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值