QA数据集,提出了一种在ADDsent对抗生成算法上的改进算法–AddSentDiverse。同样是为了消除原先算法生成的数据中潜在的统计规律,让模型无法忽略干扰的影响。
对抗样本消统
Random Distractor Placement
不同于ADDsend将distractor放到context的文末,采用随机插入的方法可以保证在不改变原先数据的依赖分布的前提下,对模型产生干扰,让模型无法忽略distractor的存在。
Dynamic Fake Answer Generation
将原先ADDsent采用的每种type固定替换词的方法,改为answer中的同类词替换
Semantic Feature Enhanced Model
在生成消统攻击样本的同时,提出在context/question中使用wordnet来增加同/反义词的指示符,从而让模型更好地学到问答中的情感信息。
self
虽然采用了一些方法弥补了ADDsent在生成攻击样本上的缺陷,但是ADDsent这种算法生成的distractor只是简单的entity replace,这种distractor的本身也并不是一种好的选择(畸形distractor)