【NLP论文阅读】-Building End-to-End Dialogue Systems Using Generative Hierarchical Neural Network Models

NNNNwang

已于 2023-11-01 17:10:15 修改

阅读量118

点赞数

分类专栏： NLP读论文文章标签：自然语言处理论文阅读人工智能

于 2023-11-01 17:05:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62525850/article/details/134140172

版权

NLP读论文专栏收录该内容

2 篇文章 0 订阅

订阅专栏

摘要：本网络是基于层次编码解码循环网络构成的。通过引导从大型语料库和预先词嵌入中学习，该网络有一个好的表现性。

以往研究存在的缺陷：1.需要大量特殊标注过的语料库 2. 需要一群人与未成熟的系统交互 3. 需要手工的特征

RNN的多种用法，本文使用下面第四个用法：输入一个语句，产生长序列回答

Hierarchical Recurrent Encoder-decoder：

模型分为两层：第一层为token层，第二层为utterance层。网络结构如下

sequence 按照顺序输入encoder，最后一层的hidden state构成utterance，次层也即为token层；

第二层为context hidden state，为第二层query处理层，积累多次对话信息进行传递，找到更多依赖。

Bidirectional HRED

当HRED只用于web query时，效果较好，但是当用于日常对话时，模型不太适用。

在token层采用Bid-RNN进行改进，forward层积累n之后的上下文信息；backforward将语句顺序调换，积累n之前的上下文信息。并且在以下两种情况中，使用bid-RNN：

（1）将每个RNN的最后hidden state连接作为contextRNN的输入

（2）在每个链条的时间维度上使用L2池化层，并且将这两个池化层连接作为输入。

bid-RNN有利于捕捉更多的短期依赖。

Bootstrapping from word Embeddings and Subtitle Q-A

对模型使用预训练：

（1）使用Word2vec在Google News corpus中对word embedding metric E训练

（2）使用SubTle对整个模型进行预训练

模型评估：采用word perplexity

结果

预训练对模型的优化效果比改变网络结果的优化效果更大。

该表中MAP是HRED-bid +SubTle的结果，可看出MAP回答更加通用性，产生这种现象的原因：由于数据稀缺，模型产生最常见的回答语句。同时回答通常与U1，U2采用相同的标点符号和代词2，阻碍了回答的多样性和主题性。产生这种现象的原因是：基于 MAP （beam search）输出的指标（如余弦相似度、BLEU、Levenshtein 距离）将主要偏向于输出与测试语篇中相同数量的标点符号和代词的模型，而不是相似语义内容（如名词和动词）的模型。

文章建议探索将语义结构与句法结构明确分开的神经架构。最后，三元组的上下文可能太短。在这种情况下，模型应该从较长的上下文和其他信息源（如语义和视觉信息）中获益。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【NLP论文阅读】-Building End-to-End Dialogue Systems Using Generative Hierarchical Neural Network Models

该表中MAP是HRED-bid +SubTle的结果，可看出MAP回答更加通用性，产生这种现象的原因：由于数据稀缺，模型产生最常见的回答语句。同时回答通常与U1，U2采用相同的标点符号和代词2，阻碍了回答的多样性和主题性。产生这种现象的原因是：基于 MAP （beam search）输出的指标（如余弦相似度、BLEU、Levenshtein 距离）将主要偏向于输出与测试语篇中相同数量的标点符号和代词的模型，而不是相似语义内容（如名词和动词）的模型。预训练对模型的优化效果比改变网络结果的优化效果更大。
复制链接

扫一扫

专栏目录

NNNNwang CSDN认证博客专家 CSDN认证企业博客

码龄3年

34: 原创

135万+: 周排名

31万+: 总排名

1万+: 访问

: 等级

358: 积分

3: 粉丝

8: 获赞

9: 评论

24: 收藏

私信

关注

热门文章

分类专栏

NLP读论文 2篇
动态规划 4篇
pytorch学习 3篇
leetcode 5篇
人工智能 1篇
蓝桥杯 10篇
计算机网络 1篇
学习记录 5篇
并查集 1篇
搜索 2篇
模拟 2篇
枚举 2篇
公式规律 1篇

最新评论

蓝桥杯题目 2682: 蓝桥杯2022年第十三届省赛真题-GCD
2301_80207550: 哥，你的思路我用C语言实现了一下，能得40分，但我不知道你这个思路的原理是什么，能具体讲一下吗？ #include<stdio.h> #include<math.h> int gcd(int a,int b){ return b?gcd(b,a%b):a; } int max(int a,int b){ if(a>b){ return a; } else{ return b; } } int min(int a,int b){ if(a<b){ return a; } else{ return b; } } int main(){ int a,b; scanf("%d %d",&a,&b); int t=abs(a-b); int i,k; if(t<a&&t<b){ for(i=1;;i++){ if(t*i>max(a,b)){ break; } } k=t*i-max(a,b); } else if(t>min(a,b)&&t<max(a,b)){ k=t-min(a,b); } printf("%d",k); }
蓝桥杯题目 2682: 蓝桥杯2022年第十三届省赛真题-GCD
Bowser_H: 最大公约数（公因数），最小公倍数，看这篇文章给我人都看迷糊了
蓝桥杯题目 2682: 蓝桥杯2022年第十三届省赛真题-GCD
大爷的溜溜球: 规定了输出的是正整数
蓝桥杯题目 2682: 蓝桥杯2022年第十三届省赛真题-GCD
NNNNwang: （21+k,100+k)的最大公约数为79。例如当k=58时，(21+58,100+58)的最大公约数为79
蓝桥杯题目 2682: 蓝桥杯2022年第十三届省赛真题-GCD
逐梦556: 作者这个程序运行，输入结果6和9的话，输出是3，我想知道为什么呀，9和12的最大公约数和6和9的最大公约数不都是3吗，那么输出不应该是0吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。