【深度学习笔记1】-pytorch的dataloader参数shuffle设置true或false

Sunny亮

已于 2022-03-12 10:37:56 修改

阅读量1.7w

点赞数 16

分类专栏： pytorch 深度学习 LSTM 文章标签： pytorch 深度学习人工智能 LSTM预测时序数据

于 2021-12-26 15:01:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41165844/article/details/122155383

版权

作为一名深度学习的小白，最近在做LSTM预测股票问题，发现训练集的shuffle必须为true而测试集的shuffle必须为false。如果训练集的shuffle不设置为true的话训练出来的模型不泛化，也就是只适合预测这一个数据集，换到别的数据集上效果不好也有可能在本数据集上预测的效果也不好。而测试集的shuffle不建议设置为true，一般的教程上只是提了要把训练集的shuffle设置为true，没有提测试集的要不要设置为true，所以困扰了我好几天。至于为什么测试集不能设置为true，我还没有整明白，在这里只是记录一下自己的学习过程和错误。

~~在LSTM预测时序数据的背景下，不把测试集shuffle设置为true是因为：~~

该模型的目的是去寻找该序列数据的规律，如果把测试集的顺序打乱那么LSTM预测结果的target就是混乱的，而LSTM预测出来的结果还是按照序列数据的那个规律预测的，那么展示的结果就是不准确的，驴唇对马嘴了属于是

~~最后，~~

~~因为LSTM需要的是序列数据，而训练集加载器的shuffle=true的话不就把这个序列打乱了吗？~~

猜想1：因为在将时序数据切割成监督数据的时候，比如time_step=3，那么就是三个数据一组，这个时候序列数据的顺序还是没有被打乱的，shuffle=true被打乱的顺序只是组与组之间的顺序，而组内数据与数据之间的顺序没有被打乱。

猜想2：如果上面的猜想1不成立的话，有两种解决办法：第一种就是训练集的加载器shuffle不设置为true，第二种方法是向数据中添加一个维度，这个维度代表了数据在序列中的位置信息࿰

最低0.47元/天解锁文章

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。