重访马尔可夫生成式任务型对话 Revisiting Markovian Generative Architectures for Efficient Task-Oriented Dialog Sys

AIMasterStar

已于 2022-07-08 16:27:38 修改

阅读量305

点赞数

分类专栏：智能语音对话与AI大模型文章标签：深度学习人工智能自然语言处理神经网络

于 2022-07-08 16:21:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AIMasterStar/article/details/125666739

版权

智能语音对话与AI大模型专栏收录该内容

17 篇文章 26 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

研究发现，基于马尔可夫的生成架构（MGA）在任务型对话系统中可以有效减少计算和内存成本，同时在性能上与基于Transformer的非马尔可夫模型相当。MGA在低资源和半监督学习场景下展现出更高的学习效率，为构建高效的任务型对话系统提供了新的视角。

摘要由CSDN通过智能技术生成

这项工作是清华大学欧智坚老师团队和中移动研究院冯俊兰老师团队合作的工作。基于马尔科夫生成框架在任务型对话数据集MultiWOZ2.1上获得了较好性能。整体来看，本文属于一篇讨论型论文，认为维护的对话状态和当前用户输入以上一轮的系统响应已经足以表征完整的对话历史，在生成模型训练和推断时不需要再将所有的对话历史全部输入，不仅带来计算和显存的巨大消耗，还容易引入冗余噪音。我们在这里详细介绍一下该工作的细节。

相关代码Github：https://github.com/SereTOD/SereTOD2022/tree/main/Track2/baseline

目录

A. 数据集

B. 评估方法

C. 基准实验结果

D. 低资源和半监督学习下的结果

E. 样例分析

参考文献：

摘要：

近期，基于Transformer的预训练语言模型（PLM），如GPT2和T5，已被用于构建生成式任务型对话（TOD，Task-Oriented Dialog）系统。现有PLM模型的一个缺点是其对话轮次间的非马尔可夫框架，即在每个对话轮将整个对

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIMasterStar 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。