录播视频地址:AIS 2022丨ACL-IJCAI-SIGIR顶级会议论文报告会回放视频公开啦
智源官网活动主页,有详细议程的介绍:ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2022)
本文关注5月14日的对话和生成部分。主要内容是截图slides,并附注一些讲解内容。比我之前写cs224w和李宏毅的笔记会简略很多,在图中不言自明的内容我就不另附介绍了。
1. 前沿趋势报告2:AIS2022对话与生成研究概述
哈尔滨工业大学张伟男
选择了一些代表性文章
AIS 2022
ACL 2022
state tracking(domain的slot)
串联为pipeline
IJCAI 2022
SIGIR 2022
当前会话、用户历史信息、相似用户
2. Session 3:Dialog and Generation(对话和生成)
1. AdaLoGN
南京大学厉肖
蕴涵关系
由已知关系推到出其他关系的过程→对图上结构的扩展
四选一
初始构建图
句法规则(否定,如动词互为反义词)
神经+符号推理
roberta→token平均值
图扩充
2. 结合任务对话和开放域对话的语料集
百度徐俊
黄色部分:知识型对话
问答对话
语料集
The PLATO-MT Model with Prompt-based Mechanism
DuClarifyDial as a New Benchmark
3. 问题生成
复旦大学
彩色是要求的答案,模型需要学会提问
本文针对multi-hop问题生成:
关系图
实体能够保证问题深度(美国总统妻子是什么职业)
当前实体是否必须出现在问题中(flag)
4. 预训练模型里的隐变量
复旦大学陈伟
未来预测策略:可以让解码器有更好的规划能力
KL loss:假设原来是正态分布,最小化分布差值
free bits:KL loss达到一定阈值后才开始优化
BOW loss:隐变量直接非自回归地预测词汇,希望隐变量能够包含response信息
先在reddit-short上用比较大的batch size做预训练,再在reddit-long上用比较小的batch size做预训练
同时增加相关性BLEU和多样性distinct(一般不能同时)
5. 检索式对话
复旦大学陈伟
本文聚焦在第一阶段,有大量response,抽取
检索效率
正例:有相同response
对比损失
6. 线上陪伴型机器人、情感对话
小米李嫣然
6.1 MISC
应该指的是2021年清华的这篇:Towards Emotional Support Dialog Systems
询问情况,推理背景信息,做疏导
常识知识库
comet模型:常识生成模型,输入situation,推理出情绪状态、需求
knowledge-enhanced context representation
选择策略的分布,和矩阵相乘,得到mixed stragy representation
上述论文是这篇
长句子的混合策略
只需要原有的监督信号
6.2 C 3 K G C^3KG C3KG
常识+对话
应该选择什么知识来辅助理解对话
单轮对话,标注情感和意图
event的转折
6.3 HICR
纯文本安抚→富媒体/多模态
玩游戏、听歌
基于用户信息进行推荐
7. COSPLAY
北京工业大学徐晨
7.1 背景
7.2 动机
保持一致性的同时给对方表达更多persona的机会
7.3 模型
强化学习
鼓励提问
迫使模型围绕共同话题聊天
7.4 实验与分析
紫色表示模型对自身的关注,暗色表示对对方的
8. 中立语句演示原因
信工所李江楠
缺点是缺乏对情绪信息的使用
聚类预测