LSTM神经网络原理

最新推荐文章于 2024-04-15 09:53:52 发布

syuszu

最新推荐文章于 2024-04-15 09:53:52 发布

阅读量416

点赞数

文章标签：机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30081659/article/details/118547666

版权

整理自:https://zhuanlan.zhihu.com/p/32085405

符号定义

C[t-1]表示从t-1窗口得到的隐层状态

h[t-1]表示从t-1窗口得到的历史显层状态

X[t]表示t窗口得到的当前显层状态

Z[t]=(X[t] , h[t-1]) 历史+当前合并得到窗口t 总显层信息

所有遗忘神经元都来自于Z[t]经过变换而来，
换句话说，遗忘神经元其实就是Z[t]的多元函数(本文中记为f0，f1，f2...)
一般外层会再嵌套一层sigma或tanh函数，以控制值域。
嵌套这一步骤并不是一成不变的，可以根据训练目标个性化修改。

LSTM模型结构

简述了符号意义下面是正菜--t-1到t的演变

1. 最先被计算出来的是隐层状态
C[t-1]*tanh(f0(Z[t]))加上叠加项 tanh(f1(Z[t])) * sigma(f2(Z[t])) 得到C[t]

2. 其次被计算出来的显层状态
tanh(C[t])*sigma(f3(Z[t])) 得到h[t]

3.输出yt=f4(h[t])

模型训练

最终我们需要训练的就是f0，f1，f2，f3，f4里面的各项参数
反向传播+梯度下降搞定
完结撒花！！！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
LSTM神经网络原理

整理自:https://zhuanlan.zhihu.com/p/32085405符号定义C[t-1]表示从t-1窗口得到的隐层状态h[t-1]表示从t-1窗口得到的历史显层状态X[t]表示t窗口得到的当前显层状态Z[t]=(X[t] ,h[t-1])历史+当前合并得到窗口t 总显层信息所有遗忘神经元都来自于Z[t]经过变换而来，换句话说，遗忘神经元其实就是Z[t]的多元函数(本文中记为f0，f1，f2...)一般外层会再嵌套一层sigma或tanh函数，以控制值域。嵌套这..
复制链接

扫一扫

syuszu CSDN认证博客专家 CSDN认证企业博客

码龄9年

12: 原创

108万+: 周排名

221万+: 总排名

5298: 访问

: 等级

124: 积分

1: 粉丝

2: 获赞

0: 评论

3: 收藏

私信

关注

热门文章

分类专栏

数学物理 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。