循环神经网络中的采样问题

一个用户aaa

已于 2024-08-06 19:49:41 修改

阅读量870

点赞数 28

分类专栏：机器学习笔记文章标签： rnn 人工智能深度学习

于 2024-08-06 18:00:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79335566/article/details/140957694

版权

在构建循环神经网络时，首先需要处理数据集。接下来需要读取数据，对其进行合理采样，即将数据集划分为若干子序列。采样后的数据进行one-hot编码后，即可输入循环神经网络进行学习。

数据集的采样主要分为两种方法，随机采样和顺序分区，接下来依次进行介绍。（本文基于mxnet框架构建，使用Time Machine数据集）

随机采样

随机采样只有每个批量内部一个时间步长度的值是顺序分布的。为更好的了解采样的代码，我们首先解释用到的各种参数。

参数说明

num_steps:时间步，即生成的每个序列连续多少个值。
batch_size:批量大小，即生成多少批数据
corpus：全体语料
num_subseqs：生成子列数量（特征-标签对）

函数说明

random.shuffle()，标准类库方法，用于将内容打乱。

def seq_data_iter_random(corpus, batch_size, num_steps):  #@save
    """使用随机抽样生成一个小批量子序列"""
    # 从随机偏移量开始对序列进行分区，随机范围包括num_steps-1
    corpus = corpus[random.randint(0, num_steps - 1):]
    # 减去1，是因为我们需要考虑标签
    n

最低0.47元/天解锁文章

一个用户aaa

博客等级

码龄2年

31
原创

725
点赞

428
收藏

636
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 循环神经网络的数据集处理

下一篇：: 从零开始实现循环神经网络

最新评论

Linux编译运行cpp源文件
Camellia614: 太有用了！
C++运算符重载中容易发生的错误
一个用户aaa: 友元函数是为了让这个函数类似于在类的内部，可以直接访问类内部的变量，继承是产生这个类的子类，对这个类实现重写和扩充，任何一个能放置父类的地方都能放置其子类。友元函数是函数，继承产生的是类
C++运算符重载中容易发生的错误
爱新觉罗.胤祯（南北回归线）: 那里的友元与继承的区别是什么
用TensorFlow实现线性回归
爱新觉罗.胤祯（南北回归线）: 这块一直搞不清楚，总算学会了
论文阅读笔记：ST-MetaNet-2
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。