文档QA综述:关于多页文档,多模态,检索增强最新的进展

PDFTriage是斯坦福大学和Adobe Research提出的一种新方法,用于改善大语言模型在处理长篇、结构复杂文档时的问答准确性。通过将PDF转换为结构化元数据,模型可以利用文档结构进行检索,提高了对结构问题和表格推理的回答质量。尽管在一般文本任务中的表现稍逊,但PDFTriage在处理不同长度文档时表现稳定,且答案质量与文档长度关系不大。未来,该方法有望在处理多模态问题上取得更多进步。
摘要由CSDN通过智能技术生成

关于Document,Multimodal,RAG最新的进展

一:PDFTriage

题目: PDFTriage: Question Answering over Long, Structured Documents
机构:斯坦福大学,Adobe Research
论文: https://arxiv.org/pdf/2309.08872.pdf
任务: 结构化文档QA
Motivation:解决ChatGPT等大语言模型在处理长篇、结构复杂的文档(如PDF、网页、演示文稿等)回答不准的问题,之前的方法会存在如下的一些问题:

  1. 上下文窗口限制,一次只能处理有限tokens数目,因此需要先进行文档预处理以及分割;
  2. 文档结构化信息利用不足,比如页面,标题,表格等;查询不准确;信息获取不全;

方法:PDFTriage通过允许模型基于结构内容检索上下文来缓解上述问题。它首先将PDF转化为结构化文档元数据,为模型提供了关于文档结构的信息,然后通过使用一系列基于模型的可调用检索

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

猴猴猪猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值