[NLU] Improving Multi-turn Dialogue Modelling with Utterance ReWriter

最新推荐文章于 2024-08-02 13:41:54 发布

lwgkzl

最新推荐文章于 2024-08-02 13:41:54 发布

阅读量2k

点赞数 2

分类专栏：对话系统 NLP 文章标签： dialogue system NLG

本文链接：https://blog.csdn.net/lwgkzl/article/details/102985438

版权

NLP 同时被 2 个专栏收录

30 篇文章 2 订阅

订阅专栏

对话系统

15 篇文章 1 订阅

订阅专栏

总述：

主要是有一个utterance rewriter的机制，将一句话里面的省略和共指关系给找出来，然后形成一句新的话语，这样显示的声明一句话的省略部分和共指词可以提高对话系统的效果。具体来说对于task-oriented对话系统，提高了intention Precision（每一句话的意图检测），对于chitchat，提高了CPS：coversation-turns-persession（平均对话轮数）。

贡献：

1.首先，作者和我都觉得最大的贡献应该是一个标注了共指和省略关系的数据集，20w条对话

2.结合了transformer和point-generator从dialogu history里面重写当前这句句子，消除指代和省略

3.毕竟是wechat团队，放在实时的chatbots里面，效果很好

实验：

我认为这篇论文实验做的很充分，所以单独拿出来枚举一下。

第一个实验：

对比了直接生成模型（GEN），直接copy模型（PTR_NET），pointer-genertor模型，以及他的PTR-Y模型。其中，每一种模型，分别用transformer和lstm做encoder来比较transformer，lstm的好坏。

pointer-genertor模型和他提出来模型的不同，主要在于，pointer-genertorcopy的来源只有input和一个固定的词表（整个vocab），但是PTR_y是从dialogue history 以及当前这一句话中copy，并且有一个哨兵y 决定是从historycopy'还是从当前这句话copy。

BLEU 和rouge就不解释了，可以看下：https://blog.csdn.net/lwgkzl/article/details/100014922

EM：exact match，就是和标准答案做精准比较，然后EM还分为positive sample和negative sample，这个positive 我觉得就是有共指关系和省略关系的句子，可以看到明显结果比较差，只有55.8.negative 就是没有共指关系和省略关系的，那么直接copy就好了，所以结果比较好，也就是说这个模型可以很好的区分有没有省略和共指关系，但是在如何copy省略和共指关系上还需要加油。

此外：显然T-ptr-y最好。