【论文泛读152】R2D2:基于可微分树的递归变换器,用于可解释的分层语言建模

该论文提出R2D2模型,使用可微分的CKY二叉树模拟语言理解的分层过程。通过预训练目标扩展双向语言模型,预测单词的上下文抽象节点。文中还包括有效的修剪树归纳算法,使得模型能在无句法监督下学习解释性树结构。实验显示该方法在语言建模和无监督解析上有效,未来将进行大规模预训练和下游任务微调。
摘要由CSDN通过智能技术生成

贴一下汇总贴:论文阅读记录

论文链接:《R2D2: Recursive Transformer based on Differentiable Tree for Interpretable Hierarchical Language Modeling》

一、摘要

人类语言理解在多个粒度级别(例如,单词、短语和句子)上运行,并且可以分层组合的抽象级别越来越高。然而,现有的具有堆叠层的深层模型并没有明确地对任何类型的分层过程进行建模。本文提出了一种基于可微 CKY 风格二叉树的递归 Transformer 模型来模拟组合过程。我们将双向语言模型预训练目标扩展到该架构,尝试根据每个单词的左右抽象节点预测每个单词。为了扩大我们的方法,我们还引入了一种有效的修剪树归纳算法,以仅在线性数量的组合步骤中启用编码。语言建模和无监督解析的实验结果表明了我们方法的有效性。

二、结论

在这篇文章中,我们提出了一个有效的基于CKY来直接模拟语言话语中的层次结构。我们已经确定了我们的方法在语言建模和无监督解析上的有效性。在我们高效的线性剪枝树归纳算法的帮助下,我们的模型在没有任何句法监督的情况下快速学习可解释的树结构,这仍然被证明与人类注释的树高度兼容。作为未来的工作,我们正在研究在十亿字语料库上预训练我们的模型,就像对BERT所做的那样,并在下游任务上微调我们的模型。

三、几个算法及编码实例

算法1,修剪树归纳算法:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值