对LSTM中每个batch都初始化隐含层的理解

最新推荐文章于 2022-12-16 08:15:00 发布

Chauncey_Wang

最新推荐文章于 2022-12-16 08:15:00 发布

阅读量4.7k

点赞数 21

分类专栏：笔记文章标签：机器学习深度学习 pytorch python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39518984/article/details/109548739

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

不知道有没有人和我有一样疑惑

在LSTM相关的代码中，为什么每个batch都会将隐藏层重新初始化，

这样不会把以前训练出来的参数丢掉吗？？

比如

代码来自GitHub

看了一些解释是h与c是状态，不是参数，每个batch中都需要初始化为0，LSTM 中的参数是W,b。

网络中训练的是参数，不是状态。

说真的。。。当时我没怎么看懂。。。

咨询了实验室的师兄后，我有了自己的理解

产生误解的主要原因是我对RNN和LSTM的结构理解不深入，我们通常看到RNN结构图基本都是这样的

说实话，这个图对我这种初学者并不友好

RNN实际上应该是这样的

举个例子，解释一下RNN是如何训练的

比如这里有一句话，而这句话，就是一个batch

sentence=“我爱我的国”

进行句字的分词后是：

我爱我的国

可以表示为4个n维的词向量，这里n我用8表示

这里有四个时间步（time_steps），每个时间步分别喂入我爱我的国四个词向量

参考RNN和LSTM数据是如何喂入的

下一句话是另一个batch，比如 “我要漂亮小姐姐”

在这两个batch之间，并没有啥逻辑关系，如果我们不重新初始化

在测试的时候，batch之间的顺序会去影响测试的结果。。。

换句话说，如果不重新初始化，两个没有什么逻辑的batch之间，会被我们人为的加上逻辑，上一句的“国”，和下一句的“我”就被联系起来了

而对于下一句的batch而言应该是一个新的开始，所以当然要初始化h和c了

也许有小伙伴要问了，这样初始化，在做文本识别的时候，句与句之间的联系，不也被初始化掉了吗？

师兄给的解释是：“一般不会这么做，一般不考虑句与句之间的联系，如果必须要考虑，那么这一段落都是一个batch中的sampler，这两句话不会分到两个batch中”

在这里偷偷挂上我的大佬级师兄Kenn7，如果他的解释不对。。。请偷偷告诉我，让我去打脸，哈哈哈

今天就分享到这里，祝大家变得更强

关注

21
点赞
踩
47

收藏

觉得还不错? 一键收藏
5
评论
对LSTM中每个batch都初始化隐含层的理解

不知道有没有人和我有一样疑惑在LSTM相关的代码中，为什么每个batch都会将隐藏层重新初始化，这样不会把以前训练出来的参数丢掉吗？？比如代码来自GitHub看了一些解释是h与c是状态，不是参数，每个batch中都需要初始化为0，LSTM 中的参数是W,b。网络中训练的是参数，不是状态。说真的。。。当时我没怎么看懂。。。咨询了实验室的师兄后，我有了自己的理解产生误解的主要原因是我对RNN和LSTM的结构理解不深入，我们通常看到RNN结构图基本都是这样的...
复制链接

扫一扫

专栏目录

Chauncey_Wang CSDN认证博客专家 CSDN认证企业博客

码龄7年

51: 原创

7万+: 周排名

2万+: 总排名

24万+: 访问

: 等级

1451: 积分

87: 粉丝

385: 获赞

207: 评论

972: 收藏

私信

关注

分类专栏

笔记 7篇
python 11篇
Ubuntu 25篇
openpose 2篇
tensorflow 3篇

最新评论

解决cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2无法查看cudnn版本的问题
Mr.Nown: 多谢，博主哈
root用户安装的anaconda如何给普通用户使用
hunzhizi: sudo chmod g+x root/
openpose如何处理视频
疾风者也: 视频路径没设置好吧
2023届秋招，我重新认清了自己
SimpleCspace: 读博那一块挺真实的，我研一想读博找老板基本上就能读了，但是老板手下有20个博士，我找了几个咨询了一下，都不建议哈哈哈，现在想想对于我除了混学历和装逼可能不适合读博，没有科研热情（在老板这只能给他打工做横向
Ubuntu安装re2c和ninja
所象: 安装re2c时到了sudo make install时出现 make: *** 没有规则可以创建目标“install”。停止。这种情况怎样搞，求大佬解答

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。