#今日论文推荐# ACL 2022 | 基于神经标签搜索的零样本多语言抽取式文本摘要

#今日论文推荐# ACL 2022 | 基于神经标签搜索的零样本多语言抽取式文本摘要

这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务,并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。
抽取式文本摘要目前在英文上已经取得了很好的性能,这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言,目前很难得到大规模的标注数据。
中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使用在英文上预训练好的抽取式文本摘要模型来在其他低资源语言上直接进行摘要抽取;并针对多语言 Zero-Shot 中的单语言标签偏差问题,提出了多语言标签(Multilingual Label)标注算法神经标签搜索模型(Neural Label Search for Summarization, NLSSum)
实验结果表明,模型 NLSSum 在多语言摘要数据集 MLSUM 的所有语言上大幅度超越 Baseline 模型的分数。其中在俄语(Ru)数据集上,零样本模型性能已经接近使用全量监督数据得到的模型。
该研究发表在了 ACL 2022 会议主会长文上。

论文题目:Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization
详细解读:https://www.aminer.cn/research_report/62b9950d7cb68b460fdcfb65icon-default.png?t=M5H6https://www.aminer.cn/research_report/62b9950d7cb68b460fdcfb65
AMiner链接:https://www.aminer.cn/?f=cs

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值