[DM]Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architect

最新推荐文章于 2024-08-27 15:46:59 发布

lwgkzl

最新推荐文章于 2024-08-27 15:46:59 发布

阅读量786

点赞数

分类专栏：对话系统 NLP

本文链接：https://blog.csdn.net/lwgkzl/article/details/102645032

版权

NLP 同时被 2 个专栏收录

30 篇文章 2 订阅

订阅专栏

对话系统

15 篇文章 1 订阅

订阅专栏

总述：

这篇文章的主要特色在于生成dialogue believes，也就是作者所谓的belief span，在对话管理模块中，一般都需要首先对一句话的belief进行分类（就是一些slot-value对，一般来说分为两种类型，一种informable类型的，要告诉用户某一些具体信息，一种requestable类型的，需要记住用户需要什么。对于某一个informable类型比如说餐馆风味，有很多类（中国菜，日本菜，法国菜等等）），然后决定是哪一类，而作者的idea就是利用seq-to-seq模型，根据上一句话的belief span，上一句话的回复以及当前这句话，可以decoder当前这句话的belief span。那么利用生成做belief有啥好处呢，这样减小了模型复杂度，并且一如既往的，效果要比之前的工作好。而且因为是生成的belief span，所以处理OOV问题也有很好的进步。

主要工作：

1.核心idea就是设计了一个可以生成的belief span。

2.在这个idea的基础上，结合copynet设计了一个两阶段copy的框架TSCP

3.融合了外部知识库，（玄学融合）在最后生成的结果hideen上，cat一层kb的embedding，然后过一层GRU。。

4.reinforcement learning，这个倒是挺有意思的，就是把对话decoder的时候看成了一个强化学习的应用场景。生成下一个词看做一个action，然后因为需要使得模型多生成《address》这种placeholder，那就需要在模型生成placehoder的时候加大reward的力度。事实上如果生成一个palcehoder，reward是1，否则reward是-0.1.