lstm原理_LSTM维度详解及TF编程注意事项

最新推荐文章于 2023-03-31 18:08:20 发布

VIP文章 weixin_39722921

最新推荐文章于 2023-03-31 18:08:20 发布

阅读量1.7k

点赞数 5

文章标签： lstm原理 lstm原理及实现 lstm网络一般训练多少轮判定两个tensor维度相同

首先附上

LSTM的标准讲解，里面包括了你们想要的那几幅图。

这篇文章主要是对我这两天看的LSTM做一个笔记，主要是要搞清楚输入、输出、网络创建，包括使用Tensorflow创建LSTM多层网络的代码。随意百度一下，关于LSTM的讲解实在太多了，但是感觉总是不清晰，可能是我没用心，就浮在表面看一下，因此把自己觉得懂了的部分记录一下，希望能给也在摸索的你一点帮助。老规矩，RNN-->LSTM

下面各个图中符号的意义（该图来源于网络）：

Fig. 1. 下面的图符号的含义（该图来源于网络）。分别表示神经网络层、数组加减和点积、向量流向、串联、复制

RNN

先上一个大家都放的图（该图来源于网络），来源于网络的图我都会标明，如有侵权，联系删除。

Fig. 2. RNN原理图（该图来源于网络）

从我个人经验来看，像我一样非科班出生的，一般上来就是LSTM，其实搞明白了经典的RNN，LSTM也是一样的，下面我根据这个画一个容易理解的图（假设对传统的神经网络是了解的）：

Fig. 3. RNN详细的原理图(原创图，如有雷同，拒不删图)，细化到维度

这张图是根据自己的理解画的，如有协同，纯属巧合。本文中的RNN只采用两个网络层，各个维度我也标明了，其中

表示第

个RNN的权重，

表示第

时刻第

个RNN的隐含层神经元个数。我想这个图已经清楚地表达多层RNN是怎样前向传播的了。值得说明的是，一个RNN神经元就是一个全连接层，上面说的两层就是两个RNN神经元，再多层也是一样往后叠加，但是权重是共享的，也就是说上面两个RNN神经元，不管你的

运算多少次，都只有两个权重层。

LSTM

再来几张大家经常看到的LSTM图（以下五张图片来源于网络）

Fig. 4. LSTM 原理图（该图来源于网络）

（该图来源于网络）

（该图来源于网络）

（该图来源于网络）

（该图来源于网络）

详细地原理图是真不想画了，太复杂了，跟RNN是一样的，所以只挑重点，标注维度，这次是根据编程的来，批量训练（嘴上这么说，身体却很诚实，花了两个小时画了张图，好累）：

Fig. 5. 细化到维度的LSTM原理图(原创图，如有雷同，拒不删图)；要注意地是：每个LSTM神经元的4个权重维度都一样=[m+n, n]，其中m为输入的维度，n为当前神经元的隐含层神经元个数；

图中

表示第

最低0.47元/天解锁文章

weixin_39722921

关注

5
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
lstm原理_LSTM维度详解及TF编程注意事项

首先附上LSTM的标准讲解，里面包括了你们想要的那几幅图。这篇文章主要是对我这两天看的LSTM做一个笔记，主要是要搞清楚输入、输出、网络创建，包括使用Tensorflow创建LSTM多层网络的代码。随意百度一下，关于LSTM的讲解实在太多了，但是感觉总是不清晰，可能是我没用心，就浮在表面看一下，因此把自己觉得懂了的部分记录一下，希望能给也在摸索的你一点帮助。老规矩，RNN-->LSTM下面...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。