记忆网络之在对话系统中的应用

最新推荐文章于 2023-07-26 22:03:55 发布

liuchongee

最新推荐文章于 2023-07-26 22:03:55 发布

阅读量3k

点赞数 1

分类专栏： QA 深度学习 nlp 深度学习与NLP--论文笔记和TensorFlow实现 QA_对话机器人_机器阅读专题文章标签：深度学习记忆网络对话系统 NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuchonge/article/details/78555958

版权

本文介绍了记忆网络在对话系统中的应用，探讨了端到端对话系统的发展，包括评估标准、数据集构建和模型训练。文章提到了四种对话系统能力，并通过Memory Networks与其他模型对比，展示了其在QA、推荐、多轮对话和闲聊任务中的优势。此外，还讨论了基于对话的监督任务和目标导向的对话系统训练方法。

摘要由CSDN通过智能技术生成

记忆网络之在对话系统中的应用

前面几天看了下Jason Weston等人在对话系统方面的工作，可以看成是对Memory Networks的扩展吧，应用到了对话领域中，主要看了下面三篇论文，基本上是按照发表时间顺序来的，接下来我们逐篇来介绍一下其主要工作内容：

evaluating prerequisite qualities for learning end-to-end dialog system
Dialog-based Language Learning
learning end-to-end goal-oriented dialog

evaluating prerequisite qualities for learning end-to-end dialog system

这篇文章是15年发表的，主要贡献是提出一个评估端到端对话系统性能的指标以及相关的数据集。目前对话系统可以分成三个类别：

1，传统的对话系统中常常使用对话状态跟踪组件+对话相应生成组件来完成对话，这样就需要结合预先定义好的状态结构、用户话语、上一轮对话以及一些别的外部信息，而且每一轮对话都需要标记其内部状态并精准的分析用户意图，这就导致其很难推广到大规模应用。

2，基于神经网络的端到端对话系统，其不需要状态跟踪组件，直接根据对话的上下文和用户当前输入生成回复，并且可实现端到端的反向传播训练。但是这就导致了其没有办法使用之前的数据集进行训练和测试（都针对状态跟踪设计）。所以目前一般使用人工评分（很难扩展）或者BLEU得分来评价模型的效果，但是往往不能够达到评价的标准。

3，本文提出的数据集和模型，第二种方法的缺点主要在于BLEU在带有目的性的对话中不能够起到很好的效果，比如特定的领域，电影推荐、餐厅助手等。

本文作者认为一个对话系统应该具有下面的四种能力才可以很方便的推广到其他领域中。作者以电影推荐助手为切入点，使用OMDb、MovieLens、Reddit构建了四个数据集，分别解决四个问题。如下：

QA：用于测试对话系统能否回答客观问题，类似于一个给予KB知识库的问答系统，给予SimpleQuestions数据集进行修改以适应本文的要求。其中每个问题会有一个答案列表，模型只需要生成一个答案列表即可

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。