有关深度学习数据集训练前的shuffle

最新推荐文章于 2023-07-03 03:00:00 发布

VIP文章小卜妞~

最新推荐文章于 2023-07-03 03:00:00 发布

阅读量2.4k

点赞数 2

分类专栏：机器学习之路文章标签： shuffle pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33866063/article/details/117468162

版权

一、为什么要shuffle？shuffle有什么作用？

防止过拟合
随机优化（梯度下降），容易找到最优解，容易收敛
机器学习，前提假设是独立同分布。不论是机器学习还是深度学习，我们总是基于数据独立同分布的假设条件，也就是说，数据的出现应该是随机的，而不是按照某种顺序排列好的。以上就是需要shuffle的根本原因。因此，我们需要在每个epoch的开始把数据shuffle一下

参考掘金的一篇博文，如下图，我们用梯度下降来优化损失函数J，在给定参数W和学习步长时，固定顺序的数据集（假设相同类别的样本都紧密排列），如果不随机打乱样本，那么，在一段时间内，收敛方向会沿着某一个类别，即同一个方向进行，如下图的红色箭头。打乱样本的目的，就是为了使得收敛的方向更加随机化，有机会转向白色箭头，向最优解收敛。

固定的数据集顺序，严重限制了梯度优化方向的可选择性，导致收敛点选择空间严重变少，容易导致过拟合。模型是会记住数据路线的。
在这里插入图片描述

1.

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
5
评论
有关深度学习数据集训练前的shuffle

一、为什么要shuffle？shuffle有什么作用？防止过拟合随机优化（梯度下降），容易找到最优解，容易收敛机器学习，前提假设是独立同分布。不论是机器学习还是深度学习，我们总是基于数据独立同分布的假设条件，也就是说，数据的出现应该是随机的，而不是按照某种顺序排列好的。以上就是需要shuffle的根本原因。因此，我们需要在每个epoch的开始把数据shuffle一下参考掘金的一篇博文，如下图，我们用梯度下降来优化损失函数J，在给定参数W和学习步长时，固定顺序的数据集（假设相同类别的样本都紧密排列
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。