哈工大SCIR十篇长文被EMNLP 2022主会及子刊录用

最新推荐文章于 2024-12-15 17:40:42 发布

zenRRan

最新推荐文章于 2024-12-15 17:40:42 发布

阅读量1.6k

点赞数 1

文章标签：大数据编程语言 python 机器学习人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247514573&idx=4&sn=9627a0c3f5dc60e76101e051ea3e33c9&chksm=eb53ad5edc2424481a168b104a5a201bc7c13bdea88d324bf86954d47fe8f41d536734e516c5&scene=126&&sessionid=0

版权

每天给你送来NLP技术干货！

来自：哈工大SCIR

EMNLP 2022（The 2022 Conference on Empirical Methods in Natural Language Processing）将于2022年12月7日至11日以线下和在线混合会议的形式举办。EMNLP是计算语言学和自然语言处理领域顶级国际会议之一，CCF B类会议，由ACL SIGDAT（语言学数据特殊兴趣小组）主办，每年举办一次。

EMNLP 2022接收的论文覆盖了对话交互系统、信息抽取、信息检索和文档分析、词法语义、语言学理论、认知建模和心理语言学、用于NLP的机器学习、机器翻译与多语言、问答、句子级语义学、情感分析和论点挖掘、文本挖掘和NLP应用、文本推理等自然语言处理领域众多研究方向。

哈尔滨工业大学社会计算与信息检索研究中心有10篇长文被录用，其中7篇被主会录用，3篇被Findings of EMNLP子刊录用。下面是论文列表及介绍：

题目：Face-Sensitive Image-to-Emotional-Text Cross-modal Translation for Multimodal Aspect-based Sentiment Analysis

作者：杨浩，赵妍妍，秦兵

录用类别：主会

简介：现有的大部分在多模态图文细粒度情感分类任务上的工作都利用了对象级的视觉语义信息，但忽视了显式利用视觉模态中的细粒度情感线索，如何从视觉模态中捕获细粒度情感线索并与文本模态建立跨模态对齐关系仍是该问题的核心挑战。在本文中，我们尝试发掘图像中人脸信息来获取视觉情感线索，并通过结合跨模态转换的思想，提出人脸敏感的图文细粒度情感分类方法FITE，将视觉信息文本化并建立与Aspect的跨模态的细粒度对齐关系。实验证明，我们的方法在不需要额外训练新的image caption模型的情况下，在两个基准数据集上实现了SOTA的效果。

题目：STGN: an Implicit Regularization Method for Learning with Noisy Labels in Natural Language Processing

作者：吴婷婷，丁效，唐旻骥，张浩，秦兵，刘挺

录用类别：主会

简介：标签噪声（noisy labels）普遍存在于NLP的各项任务中，而现有的工作（即NLP中带标签噪声的学习）常局限于特定的任务或者训练步骤，使得上述这些方法很难被广泛应用。在本工作中，我们提出利用一种良性噪声来对抗固有的标签噪声。作为一种通用方法，我们在三种不同的NLP任务上进行了实验，通过详尽的理论分析和实验结果表明本文提出方法的有效性。

题目：A Distributional Lens for Multi-Aspect Controllable Text Generation

作者：顾宇轩，冯骁骋，马思成，张凌源，龚恒，秦兵

录用类别：主会

简介：多属性可控文本生成是比单属性控制更具挑战性和实用性的任务。现有的方法通过融合从单属性学习到的多个控制器来实现复杂的多属性控制，但会面对控制器相互干扰的问题。为了解决这个问题，我们从分布的角度提供了对属性融合的观察，并提出直接搜索多个属性分布的交叉区域作为它们的组合并进行生成。我们的方法首先用自编码器结构估计属性空间。之后，我们通过同时最小化到不同属性样本点的距离来迭代地接近交叉区域。最后，我们使用基于前缀调整的解码器将它们映射到与属性相关的句子。在三种控制任务上（包括情感控制、主题控制和文本去毒）的实验表明，我们的方法在属性相关性和文本质量方面优于几个强大的基线，并达到了SOTA。后续分析也为我们方法的有效性提供了一些解释性支持。

题目：Unifying the Convergences in Multilingual Neural Machine Translation

作者：黄毅翀，冯骁骋，耿昕伟，秦兵

录用类别：主会

简介：多语言机器翻译 (Multilingual Neural Machine Translation) 旨在使用一个统一的模型来完成多种语言对的翻译，这种方式不仅极大降低了部署成本，更提升了低资源语言对的翻译性能。尽管取得了不错的进展，但现有研究忽略了其中存在的收敛不一致性问题，即不同的语言在训练的不同轮数上达到最优。这一问题使得最终训练得到的模型过拟合低资源语言而欠拟合高资源语言。因此，本文提出语言特定的自蒸馏算法来统一不同语言的收敛性。我们通过实验证明了本文方法在缓解收敛不一致性的有效性，并极大提升了多语言翻译的性能。

题目：Distilled Dual-Encoder Model for Vision-Language Understanding

作者：汪泽堃，王文辉，朱海潮，刘铭，秦兵，韦福如

录用类别：主会

简介：在视觉语言理解（VLU）任务上，融合编码器视觉语言模型取得了卓越的结果，但由于同时对图像和文本进行编码，牺牲了效率。相反，分别对图像和文本进行编码的双编码器模型在效率方面具有优势，而在VLU任务上则由于缺乏深层次的跨模态互动而失败。为了两全其美，我们提出了DiDE，一个将融合编码器模型（教师）的知识蒸馏至双编码器模型（学生）的框架。由于跨模态交互是教师表现优异的关键，但在学生模型中却没有，我们鼓励学生在训练过程中不仅要接近教师的预测，还要同样计算跨模态的注意力分布并与教师对齐。实验结果表明，DiDE在性能上取得了与融合编码器的教师模型有竞争力的结果（只下降了1%），同时有4倍的加速。进一步的分析显示，我们提出的跨模态注意力蒸馏机制对于我们框架的成功至关重要。

题目：ReCo: Reliable Causal Chain Reasoning via Structural Causal Recurrent Neural Networks

作者：熊凯，丁效，李忠阳，杜理，刘挺，秦兵，郑毅，怀宝兴

录用类别：主会

简介：因果事件链对于很多AI决策系统来说具有重要意义。目前大部分获取因果事件链的方法首先抽取出大量且高质量的因果事件对，然后根据事件之间的文本或语义相似度将事件对连接成因果事件链或事件图，这种简单的因果事件链的构建方法会导致一系列的因果传递性的问题，从而导致因果链不可靠，其中最显著的是阈值效应和场景漂移问题。为了解决这两类问题，我们首先定义了因果链推理任务，并提出了一个可靠的因果链推理框架(ReCo)，ReCo对于每个因果链构建一个结构因果模型，利用结构因果模型中的外生变量来表示因果链中每个因果对的阈值和场景因素，然后利用条件变分自编码器对外生变量进行隐式地捕获，最后提出一个结构因果循环神经网络对结果因果模型进行建模。在中英文因果链推理数据集上的实验证明了ReCo的优越性。额外的消融实验以及知识注入实验进一步验证了ReCo的有效性。

题目：Towards Knowledge-Intensive Text-to-SQL with Formulaic Knowledge

作者：窦隆绪，高妍，刘栩祺，潘明扬，王丁子睿，车万翔，靳民彦，战德臣, 楼建光

录用类别：主会

简介：在本文中，我们提出了一种新的任务，名为“知识密集型的SQL语义解析”，以解决专业数据分析场景中对于表格结构的专业提问（例如“金砖国家中哪一个公司的EBIT最大？”中的“金砖国家”与“EBIT”都是专业术语）。我们首先构建了一个新的中文数据集KnowSQL，涵盖三个专业领域（金融、交通、房地产）。为了解决该问题，受人类学习过程的启发，我们进一步提出了ReGrouP框架，使模型具备开卷考试（检索知识、编辑知识、运用知识）的能力，以高效便捷地解决垂直领域下的数据分析。而知识的来源和形式，我们将其创新地将其表示为公式型知识（Formulaic Knowledge），这类知识相比文本型知识，更加简洁准确，并且和SQL形式更加接近。相关的样例分析和实验结果表明，KnowSQL是一个非常有挑战的数据集，现有的基线方案难以符合专业场景的需求；而ReGrouP通过简单的通过扩充公式知识库，能达到边做边学（learning-on-the-fly）的目的，快速达到理想效果。审稿人一致认为该方案会在垂直领域的NLP应用方面激发出新的研究思路。

题目：Knowledge-centric Response Selection for Document-grounded Dialogue

作者：马龙轩，张伟男，李佳朋，李明达，刘挺

录用类别：Findings of EMNLP 子刊

简介：基于文档的对话使用非结构化文档作为对话上下文的额外知识，进而提升对话的质量。在检索模型中，之前的方法通常以对话为中心建模，这导致在知识筛选阶段的误差会级联传播到回复筛选任务上。因此本文提出一种以知识为中心的方法来建模不同元组之间的关系。实验证明该方法能够大幅提升知识筛选和回复筛选的准确度。

题目：TSGP: Two-Stage Generative Prompting for Unsupervised Commonsense Question Answering

作者：孙月晴，张宇，齐乐，施琦

录用类别：Findings of EMNLP 子刊

简介：无监督常识问答需要在不依赖标注数据的情况下挖掘有效的常识知识。目前的工作通常从传统知识库中检索知识或使用预训练语言模型生成固定类型的知识，泛化能力较差。在本工作中，我们利用存储在预训练语言模型中的隐式知识来解决上述限制，提出一个基于两阶段提示的无监督常识问答框架（TSGP）。对三种不同的常识推理任务CommonsenseQA、OpenBookQA 和 SocialIQA 的实验结果和分析表明，TSGP在无监督设置下显着提高了语言模型的推理能力。

题目：LEMON: Language-Based Environment Manipulation via Execution-Guided Pre-training

作者：施琦，刘乾，陈蓓，张宇，刘挺，楼建光

录用类别：Findings of EMNLP 子刊

简介：基于自然语言的环境操纵（Language-based environment manipulation，LEM）需要模型根据自然语言指令来控制环境的改变，由于环境的巨大空间，这具有巨大的挑战性。目前的工作大部分只适用于特定环境，其难以跨环境泛化。在这项工作中，我们提出了LEMON，一个LEM任务的通用框架。具体来说，我们首先为LEM任务设定了一种任务无关的方法，该方法可以使用相同的生成式语言模型来处理多种环境。然后，我们提出了一种执行指导的预训练策略，其通过纯合成预训练语料库将环境的先验知识注入到语言模型中。在 ALCHEMY、SCENE、TANGRAMS、PROPARA 和 RECIPES 任务上的实验结果证明了 LEMON 的有效性：LEMON在其中的四个数据集上取得了SOTA结果，并且执行引导的预训练策略为所有五个任务带来了显著改进。

本期责任编辑：赵森栋

本期编辑：钟蔚弘

📝论文解读投稿，让你的文章被更多不同背景、不同方向的人看到，不被石沉大海，或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

为什么回归问题不能用Dropout？

Bert/Transformer 被忽视的细节

中文小样本NER模型方法总结和实战

一文详解Transformers的性能优化的8种方法

DiffCSE: 将Equivariant Contrastive Learning应用于句子特征学习

苏州大学NLP团队文本生成&预训练方向招收研究生/博士生（含直博生）

NIPS'22 | 重新审视区域视觉特征在基于知识的视觉问答中的作用

武汉大学提出：用于基于统一Aspect的情感分析的关系感知协作学习