对话系统论文集（2）-MDAP网络

最新推荐文章于 2024-05-31 14:43:24 发布

zixufang

最新推荐文章于 2024-05-31 14:43:24 发布

阅读量400

点赞数

分类专栏：对话系统&强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yagreenhand/article/details/87893114

版权

本文介绍了一种基于多智能体对话策略的MDAP网络，旨在解决领域迁移和新slot处理问题。通过将对话状态和动作分为与语义槽相关和无关的部分，实现了更有效的训练。在DSTC数据集上，MDAP网络展示了其在领域扩展时的优越性能，新加入的S-Agent与特定语义槽关联，加速了训练过程。

摘要由CSDN通过智能技术生成

解决问题：
新的slot作为数据库搜索参数；领域迁移难、学习更快
背景：

置信状态

bg是置信对话状态中与语义槽无关的部分，bi是置信状态中与第 i 个语义槽相关的部分。
可能的动作集合为A

Ag是可能的对话动作中与语义槽无关的动作的集合，Ai是可能的动作中与第 i 个语义槽相关的对话动作的结合。
DSTC数据集：
每个分为label和log；
label：直接是json形式：

槽已经处理好了。

创新点：

多智能体对话策略
本文根据是否和语义槽相关的置信状态和动作状态，提出了类似原理的多agent训练。
有一个agent是和状态无关的，其他的都相关。然后 agent之间共享参数，我觉得像是增加了参数。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。