对话系统论文集(2)-MDAP网络

本文介绍了一种基于多智能体对话策略的MDAP网络,旨在解决领域迁移和新slot处理问题。通过将对话状态和动作分为与语义槽相关和无关的部分,实现了更有效的训练。在DSTC数据集上,MDAP网络展示了其在领域扩展时的优越性能,新加入的S-Agent与特定语义槽关联,加速了训练过程。
摘要由CSDN通过智能技术生成

解决问题:
新的slot作为数据库搜索参数;领域迁移难、学习更快
背景:

  • 置信状态

    bg是置信对话状态中与语义槽无关的部分,bi是置信状态中与第 i 个语义槽相关的部分。

  • 可能的动作集合为A
    在这里插入图片描述
    Ag是可能的对话动作中与语义槽无关的动作的集合,Ai是可能的动作中与第 i 个语义槽相关的对话动作的结合。

  • DSTC数据集:
    每个分为label和log;
    label:直接是json形式:

    槽已经处理好了。

创新点:

  • 多智能体对话策略
    本文根据是否和语义槽相关的置信状态和动作状态,提出了类似原理的多agent训练。
    有一个agent是和状态无关的,其他的都相关。然后 agent之间共享参数,我觉得像是增加了参数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值