PyTorch-RNN笔记

最新推荐文章于 2024-08-16 22:27:00 发布

糖人豆丁

最新推荐文章于 2024-08-16 22:27:00 发布

阅读量199

点赞数

分类专栏： AI DeepLearning 文章标签： RNN PyTorch

本文链接：https://blog.csdn.net/newmemory/article/details/86771344

版权

AI 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

DeepLearning

2 篇文章 0 订阅

订阅专栏

时间序列
1. 采用两种数据表示方式：[word_num, batch, word_vec]和[batch, word_num, word_vec]
2. PyTorch中Embedding有两种表示方式：word2vec和GloVe，而且已经提供了实现方式。
  3)PyTorch中使用nn.Embedding执行查表操作，使用PyTorch中面向自然语言处理的torchnlp包可以实现。使用GloVe是一种编码方式，会直接下载一个2.18GB大小的文件，可以直接使用。
3. 也可以将输入图片看做时序信号，从上到下每个时间点对应一行像素点！
用RNN对时间信号序列进处理：
1. 公式化表示：
  h_t = f_W(h_t-1, x_t)
  ||
  h_t = tanh(W_hhh_t-1+W_xhx_t)
  y_t = W_hyh_t
  NOTE:这里Ｗ_hh和Ｗ_xh是权值共享的！
RNN训练
1. 梯度经验值是在10左右比较合适，如果大于100就会出现梯度爆炸的情形了！对于梯度爆炸，可以使用torch.nn.utils.clip_grad_norm(grad, threshold)对梯度grad进行修改，使梯度的值控制在threshold的范围内，即缩小了梯度的值但并没有改变其方向！
LSTM
1. 用LSTM解决梯度弥散问题！
2. RNN的memory是short-term-memory，只能记住相近的信息；LSTM(Long short term memory)将记忆的时间序列加长了！
3. 对记忆信息h_t-1，应用一个"闸门"有目的性的进行过滤，对当下的信息x_t也应用一个“闸门”，然后对这两者进行一个“结合”，最后输出的使用也应用一个“闸门”控制信息的输出量！采用sigmoid函数控制输出量！
  
  这里的memory还是C_t，而h_t是在C_t基础上的逻辑输出，是直接拿来用的部分，而C_t会继续维护在LSTM里面！
  
  形式化表示如上图，更加形式化的理解如下图（０表示打开，１表示关闭）
4. PyTorch中LSTM的使用
5. Embedding层本质上是一张表

糖人豆丁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch-RNN笔记

时间序列采用两种数据表示方式：[word_num, batch, word_vec]和[batch, word_num, word_vec]PyTorch中Embedding有两种表示方式：word2vec和GloVe，而且已经提供了实现方式。3)PyTorch中使用nn.Embedding执行查表操作，使用PyTorch中面向自然语言处理的torchnlp包可以实现。使用GloVe是一...
复制链接

扫一扫

专栏目录