中国人工智能大赛机器阅读理解任务冠军方案出炉~

点击左上方蓝字关注我们

【飞桨开发者说】王肖,中国科学院信息工程研究所研究生在读,自然语言处理技术爱好者,研究方向为文本匹配、文本分类、本文对抗、知识蒸馏、模型压缩、推荐系统、多任务学习等。

参赛背景

在研一深度学习课程中首次接触飞桨,并有幸在研二时对PALM (PArallel Learning from Multi-tasks) [2] 这一开源的、灵活通用的NLP大规模预训练和多任务学习框架作出部分贡献。在本次中国人工智能大赛·语言与知识技术竞赛的是非观点型机器阅读理解任务中,我借助数据增广、ERNIE[6]、RoBERTa [1] 等多预训练模型微调、对抗训练、k折模型融合等方法,利用PALM框架 [2],形成基于鲁棒性优化的多模型融合学习策略,在本次个人赛最终获得冠军,测试集中达到85.55的准确率。

比赛介绍

机器阅读理解无论是在工业界还是学术界都有着很高的研究价值。本次大赛任务中所使用的DuReader [3] 数据集克服了以往 SQuAD [4] 等数据集的数据依赖人工合成、任务简单、应用领域有限等缺点。在竞赛中,竞赛者对数据集的理解至关重要。本文认为,竞赛中使用的一切方法和优化都应当是建立在竞赛者充分理解数据集这一前提下的,都应当是充分适配当前比赛任务的。此外,适当的数据增强是扩充数据规模的有效方法之一。在保证数据质量的前提下增大数据规模可以使得模型具备更好的泛化能力。

预训练的方法最初在图像领域提出,近年来,NLP领域中也涌现出越来越多的性能优异的预训练模型。基于预训练模型在下游NLP特定任务中进行微调往往能迅速得到理想效果。本文基于飞桨PaddlePaddle开源深度学习平台[5],利用了RoBERTa [1]、BERT [7] 各自具备不同特性的预训练模型在本次竞赛中的是非观点型阅读理解任务上分别进行了微调。

虽然基于预训练模型的微调可以在是非观点型机器阅读理解任务中达到较优性能,但模型的鲁棒性仍有待提高,对于一些细粒度的语义差别,模型仍难以准确捕捉。近年来,诸多研究表明机器阅读理解模型对于对抗攻击是非常脆弱的,导致其在很多应用场景上出现效果鲁棒性问题甚至安全问题。对抗训练是提高模型鲁棒性的重要方式。和图像领域不同,文本中的词语是离散的,而非连续的 RGB 值。这就导致,如果我们直接在原始本文上进行扰动,则极有可能扰动的方向和大小都没有任何明确的语义对应。但 [8] 认为 word embedding 的表示是可以认为是连续的,在word embedding上的扰动一定程度上是有意义的。本文中使用的对抗训练对word embedding添加扰动,以避免模型过拟合。

此外,模型融合借鉴集成学习的思想,在一定程度上提升模型的稳定性与泛化能力 [9]。Bagging主要在于优化variance,即模型的鲁棒性,boosting主要在于优化bias,即模型的精确性。本文中所述方法借助模型融合的方法进一步提升模型在本次竞赛任务中的表现。

综上,本文所述基于鲁棒性优化的多模型融合的是非观点极性分析方法包含数据增强、多预训练模型微调、对抗训练、模型融合等方法,具备较好的稳定性与泛化能力,在中国人工智能大赛 · 语言与知识技术竞赛 · 个人赛的最终测试集中达到85.55的准确率。

 

基于鲁棒性优化的多模型融合的是非观点极性分析方法

 

A. 任务描述

对于给定的用户输入的观点型问题q、对应候选文档d、答案段落摘要a,给出答案段落摘要所包含的是非观点极性p,其中,是非观点极性的所有极性均在{“Yes”, “No”, “Depends”}集合中,对应的含义为:

  • Yes:肯定观点,肯定观点指的是答案给出了较为明确的肯定态度。有客观事实的从客观事实的角度出发,主观态度类的从答案的整体态度来判断。

  • No:否定观点,否定观点通常指的是答案较为明确的给出了与问题相反的态度。

  • Depends:无法确定/分情况,主要指的是事情本身存在多种情况,不同情况下对应的观点不一致;或者答案本身对问题表示不确定,要具体具体情况才能判断。

B. 数据预处理与数据增强

首先将训练集、开发集、测试集样本由json格式转为tsv格式。其中,将answer、question 与yesno_answer分别提取到tsv格式的文件中,并将yesno_answer表示为数字标签形式。label中的“0”、 “1”、“2”分别对应原数据集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值