本人学习所有系列:汇总帖
这一篇文章作为精读/泛读论文的一个汇总贴。
开始新的100篇~
151-200:151-200汇总
- 主要内容:提出了一种用有向无环图建模会话上下文的新思路,并提出了一种用于会话情感识别的有向无环图神经网络——有向无环图ERC网络(ERC)。大量的实验结果表明,所提出的ERC算法可以达到与基线相当的性能。
- 主要内容:介绍了一个实用的交互式机器翻译系统。与传统的从左到右严格的IMT系统不同,TranSmart以灵活的方式进行用户和机器之间的交互,并且它特别包含翻译记忆技术,以避免在翻译过程中发生类似的错误。
- 主要内容:提出了一种新的观点,即有效地使用一致性训练来改进在标签不足的数据集上的监督文本摘要。通过将简单的噪声注入操作替换为高级的数据增强方法,例如反向翻译,我们的方法在相同的一致性训练框架下,在具有部分标记和部分未标记数据的数据集之间带来了实质性的改进。
- 主要内容:研究了语境化的单词表征在多大程度上可以识别同一动词引起的框架差异。具体来说,我们关注的是引发多个框架的动词,并基于目标动词的上下文化单词表示来执行聚类。我们计算了生成的聚类和人工标注的框架之间的匹配率,并比较了七个上下文化的单词表示:ELMo、BERTBASE、BERTLARGE、RoBERTa、ALBERT、GPT-2和XLNet。我们发现BERT、RoBERTa、XLNet和ALBERT在区分同一动词引起的框架差异方面表现出色。
- 主要内容:测试了微调对变压器表示中短语含义构成的影响。虽然我们选择的任务有望解决作文弱点和对单词重叠的依赖,但我们发现微调模型中的表示在受控作文测试中几乎没有改善,或者仅显示非常局部的改善。后续分析表明,PAWS-QQP数据集包含虚假的线索,破坏了复杂的意义属性的学习时,训练的任务。然而,来自SST调优的结果表明,在不同大小的标记短语上进行训练对于学习作文是有效的。
- 主要内容:提出了两种捕捉位置偏差的机制,即位置偏差权重和位置偏差缺失,它们被注入到现有模型中以增强表示。大量实验表明,所提出的方法可以大大提高模型的鲁棒性。
- 主要内容:研究了汉语词嵌入中的性别偏见,并将自动计算的性别偏见分数与人类态度进行了比较。我们精心呈现了编码在单词向量中的性别偏见和人们对同一形容词的感觉之间的差异。
- 主要内容:提出了一个多步骤粗到精的问答(CFQA)系统,它可以通过选择适当的动作来有效地处理长文档和短文档。该系统在四个不同的质量保证数据集上显示了良好的准确性和训练速度。提出了用DRL模型来指导多步问答推理过程的新概念,使其更接近人类的判断行为。