论文笔记--Augmenting Pre-trained Language Models with QA-Memory for Open-Domain Question Answering

最新推荐文章于 2024-11-04 20:21:57 发布

Isawany

最新推荐文章于 2024-11-04 20:21:57 发布

阅读量410

点赞数 1

分类专栏：论文阅读文章标签：论文阅读语言模型 T5 QA nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38124427/article/details/132394792

版权

论文笔记--Augmenting Pre-trained Language Models with QA-Memory for Open-Domain Question Answering

1. 文章简介
2. 文章概括
3 文章重点技术
4. 文章亮点
5. 原文传送门
6. References

1. 文章简介

标题：Augmenting Pre-trained Language Models with QA-Memory for Open-Domain Question Answering
作者：Wenhu Chen, Pat Verga, Michiel de Jong†, John Wieting, William W. Cohen
日期：2023
期刊：arxiv preprint

2. 文章概括

文章给出了一种ODQA(Open Domain Question Answering)方法QAMAT，该方法基于两阶段的训练框架，在现有RePAQ的基础上节省了内存和计算量，在多个QA benchmarks上取得更好的表现。

3 文章重点技术

3.1 QA

QA(Question Answering)可分为CBQA（Closed-Book）和ODQA（Open Domain）：

CBQA：基于大量语料库训练一个QA模型，然后直接询问模型得到答案。
ODQA：一般来说会首先对语料库进行检索，然后对检索结果进行阅读理解，给出最终的答案。
现有的ODQA中的SOTA方法为RePAQ，即在推理阶段直接访问存储的QA对，检索和当前问题相似的Q，最终基于这些问题的回答得到现有问题的答案。但上述方法有以下局限性： 1）这种方法需要大量的监督数据以供问题检索，故一般来说RePAQ需要动态更新检索库，但这个更新过程本身又是昂贵且复杂的。2）RePAQ只支持检索显式存储于索引中的问题，很难满足复杂检索的需求。

3.2 QAMAT(QA-Memory-Augmented Transformer)

为了解决上述问题1），文章提出了一种QAMAT方法。具体来说，输入文本 $X=x_1, \dots, x_n$ ，其中 $X$ 可能为预训练阶段的段落或者微调阶段的问题（Q），模型的预训练任务为：给定语料库 $X, \{Q^k, Q^k\}_{k=1}^m)$ ，其中 $A^i$ 为对应 $Q^i$ 在 $X$ 中的spans，我们从 $X$ 中随机采样 $k$ 个样本，并将对应 $A^i$ 的位置替换为[MASK]，模型需要尝试预测这些[MASK]对应的token。上述预训练目标为 $\sum_{m_i\in M} p(Y|X, m_i)p(m_i|X)\tag{1}$ ，其中 $M$ 为存储的所有问题对。

3.2.1 Encoder

文章采用了T5[1]的Encoder-Decoder基本架构。其中编码函数 $f_{\theta}: X\to \mathcal{F}_{\theta}(X) \in \mathbb{R}^{n\times d}$ 将输入序列 $X$ 映射为一个向量，然后该向量的指定位置元素被用于表征query和memory：当前问题 $X$ 的[MASK]分词对应的嵌入

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Isawany CSDN认证博客专家 CSDN认证企业博客

码龄8年

89: 原创

111万+: 周排名

11万+: 总排名

7万+: 访问

: 等级

1167: 积分

169: 粉丝

265: 获赞

46: 评论

280: 收藏

私信

关注

热门文章

分类专栏

论文阅读 80篇
吴恩达ChatGPT系列课程学习 9篇

最新评论

论文笔记--Skip-Thought Vectors
Isawany: 你试试从这下呢 http://mirror.nubenum.de/www.cs.toronto.edu/~rkiros/models/
论文笔记--Skip-Thought Vectors
xhns123: 博主好，看你的论文笔记学到了很多。我去下载skip-thought模型的时候，发现github上开源的下载链接失效了，不知道你保存了吗？如果保存了能否给我发个压缩包，万分感谢。903695886@qq.com
论文笔记--Llama3 report
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--kNN PROMPTING: BEYOND-CONTEXT LEARNING WITH CALIBRATION-FREE NEAREST NEIGHBOR INFERENCE
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Isawany: 已更正，感谢～again

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。