对话系统-“任务型”多轮对话（三）：对话策略（DP/Dialogue Policy）【根据前面的对话状态决策要采取的最优动作（如：提供结果，澄清需求..）】【基于规则（工业界用的多；可控）；基于模型】

u013250861

已于 2022-03-05 18:37:33 修改

阅读量1.4k

点赞数

分类专栏： # NLP/对话系统文章标签：对话策略任务型对话系统槽位填充状态追踪数据库交互

于 2022-03-05 18:37:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/123298996

版权

NLP/对话系统专栏收录该内容

22 篇文章

订阅专栏

对话策略模块的主要功能是根据前面的对话状态决策采取的最优动作（如：提供结果，询问特定限制条件，澄清或确认需求等）从而最有效的辅助用户完成信息或服务获取的任务。该模块基于用户输入的语义表达和当前对话状态输出下一步的系统行为和更新的对话状态。

举例
text=“人民币对美元的汇率是多少”。“查询（槽位1=人民币，槽位2=美元)”这样的形式将作为对话管理模块的输入，这时候状态追踪模块就要根据前几轮的信息，结合该输入判断该轮的查询状态，确定查询的槽位，以及与数据库的交互。如得到想要查询的确实是人民币对美元的汇率信息。这时候，根据现有的对话策略判断当前的槽位状态，最后给出对话管理模块的输出，如查询结果(源货币=人民币，目标货币=美元，汇率=1:0.16)

参考资料：
任务型多轮对话系统概述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。