ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2022）笔记3：对话和生成

最新推荐文章于 2024-03-22 15:00:33 发布

诸神缄默不语

最新推荐文章于 2024-03-22 15:00:33 发布

阅读量754

点赞数

分类专栏：人工智能学习笔记文章标签：人工智能深度学习对话系统文本生成自然语言处理

本文链接：https://blog.csdn.net/PolarisRisingWar/article/details/125909842

版权

人工智能学习笔记专栏收录该内容

242 篇文章 247 订阅

订阅专栏

诸神缄默不语-个人CSDN博文目录

录播视频地址：AIS 2022丨ACL-IJCAI-SIGIR顶级会议论文报告会回放视频公开啦
智源官网活动主页，有详细议程的介绍：ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2022）

本文关注5月14日的对话和生成部分。主要内容是截图slides，并附注一些讲解内容。比我之前写cs224w和李宏毅的笔记会简略很多，在图中不言自明的内容我就不另附介绍了。

文章目录

1. 前沿趋势报告2：AIS2022对话与生成研究概述
2. Session 3：Dialog and Generation（对话和生成）

1. 前沿趋势报告2：AIS2022对话与生成研究概述

哈尔滨工业大学张伟男
在这里插入图片描述
选择了一些代表性文章

AIS 2022

在这里插入图片描述

ACL 2022

在这里插入图片描述

state tracking（domain的slot）

串联为pipeline

IJCAI 2022

在这里插入图片描述

SIGIR 2022

在这里插入图片描述

当前会话、用户历史信息、相似用户

2. Session 3：Dialog and Generation（对话和生成）

1. AdaLoGN

南京大学厉肖
在这里插入图片描述

蕴涵关系

由已知关系推到出其他关系的过程→对图上结构的扩展

四选一

初始构建图
句法规则（否定，如动词互为反义词）

神经+符号推理
roberta→token平均值
图扩充

2. 结合任务对话和开放域对话的语料集

百度徐俊
在这里插入图片描述

黄色部分：知识型对话
问答对话

语料集

在这里插入图片描述

The PLATO-MT Model with Prompt-based Mechanism

在这里插入图片描述

DuClarifyDial as a New Benchmark

在这里插入图片描述

3. 问题生成

复旦大学
在这里插入图片描述
彩色是要求的答案，模型需要学会提问

本文针对multi-hop问题生成：
在这里插入图片描述

关系图
实体能够保证问题深度（美国总统妻子是什么职业）

当前实体是否必须出现在问题中（flag）

4. 预训练模型里的隐变量

复旦大学陈伟
在这里插入图片描述
未来预测策略：可以让解码器有更好的规划能力

KL loss：假设原来是正态分布，最小化分布差值
free bits：KL loss达到一定阈值后才开始优化
BOW loss：隐变量直接非自回归地预测词汇，希望隐变量能够包含response信息
在这里插入图片描述

先在reddit-short上用比较大的batch size做预训练，再在reddit-long上用比较小的batch size做预训练

同时增加相关性BLEU和多样性distinct（一般不能同时）

5. 检索式对话

复旦大学陈伟
在这里插入图片描述本文聚焦在第一阶段，有大量response，抽取

检索效率

正例：有相同response
对比损失

6. 线上陪伴型机器人、情感对话

小米李嫣然

6.1 MISC

在这里插入图片描述

应该指的是2021年清华的这篇：Towards Emotional Support Dialog Systems
询问情况，推理背景信息，做疏导

常识知识库
comet模型：常识生成模型，输入situation，推理出情绪状态、需求

knowledge-enhanced context representation
选择策略的分布，和矩阵相乘，得到mixed stragy representation
在这里插入图片描述
上述论文是这篇

长句子的混合策略
只需要原有的监督信号