[PyTorch 学习笔记] 8.4 手动实现 RNN

最新推荐文章于 2024-08-26 13:15:40 发布

张贤同学

最新推荐文章于 2024-08-26 13:15:40 发布

阅读量1.2k

点赞数

分类专栏： Pytorch 文章标签：深度学习自然语言处理 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BGH12ET/article/details/108978521

版权

本文详细介绍了如何在PyTorch中手动实现RNN，重点在于处理不定长输入，特别是应用于自然语言处理和时间序列任务。文章通过一个姓名分类的实例，展示了RNN的网络结构、公式及训练过程，包括输入、状态、输出的计算，并且提到了数据处理和参数更新的方式。虽然没有使用DataLoader和Dataset，但给出了如何构造数据集和进行迭代训练的步骤。

摘要由CSDN通过智能技术生成

本章代码：https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson8/rnn_demo.py

这篇文章主要介绍了循环神经网络（Recurrent Neural Network），简称 RNN。

RNN 常用于处理不定长输入，常用于 NLP 以及时间序列的任务，这种数据一半具有前后关系。

RNN 网络结构如下：

上图的数据说明如下：

$x_{t}$ ：时刻 t 的输入， $s h a p e = (1, 57)$ ，表示 (batch_size, feature_dim)。57 表示词向量的长度。
$s_{t}$ ：时刻 t 的状态值， $s h a p e = (1 ， 128)$ ，表示 (batch_size, hidden_dim)。这个状态值有两个作用：经过一个全连接层得到输出；输入到下一个时刻，影响下一个时刻的状态值。也称为hedden_state，隐藏层状态信息，记录过往时刻的信息。第一个时刻的 $s_{t}$ 会初始化为全 0 的向量。

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

张贤同学 CSDN认证博客专家 CSDN认证企业博客

码龄12年

43: 原创

7万+: 周排名

116万+: 总排名

4万+: 访问

: 等级

830: 积分

115: 粉丝

114: 获赞

37: 评论

387: 收藏

私信

关注

热门文章

分类专栏

Pytorch 26篇
NLP 4篇
计算机视觉 1篇
数据竞赛 3篇
深度学习 2篇
Python 1篇
数据结构 1篇
Java 3篇
论文 1篇
机器学习 1篇

最新评论

阿里天池 NLP 入门赛 TextCNN 方案代码详细注释和流程讲解
事不决: 跑出来得分才0.12。。。
图神经网络 PyTorch Geometric 入门教程
weixin_44672799: 说明每一个点是属于哪个batch的
PyTorch 实现 Skip-gram
埃文想投三分球: 博主你好！请问最后输出到文件里的结果是什么呀？我这边在pycharm里复现的你的代码，文件里面的内容之间乱码了
阿里天池 NLP 入门赛 TextCNN 方案代码详细注释和流程讲解
weixin_44248186: 博主你好，首先感谢你的分享，真的很清晰！有一个小问题自己没想明白，想问一下。4.2.6的sentence_split()和4.2.7的get_examples()的共同参数max_segment为什么设置的不一样呢？get_examples()中调用了sentence_split()，那么get_examples(max_segment=8)不是就覆盖了sentence_split(max_segment=16)的参数吗？sentence_split()的参数设置还有意义吗？不知道哪里想错了，期待你的回复！
阿里天池 NLP 入门赛 TextCNN 方案代码详细注释和流程讲解
阿森阿森: 你自己的数据集

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。