pytorch：批量数据分割（batch）

最新推荐文章于 2024-07-18 22:55:19 发布

XYKenny

最新推荐文章于 2024-07-18 22:55:19 发布

阅读量7.6k

点赞数 3

分类专栏： pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/XYKenny/article/details/105935836

版权

深度学习训练时，为避免数据相关性影响模型，通常采用小批量梯度下降。PyTorch中的DataLoader工具用于将数据转换为Tensor并分批处理，便于高效且独立地迭代数据。

摘要由CSDN通过智能技术生成

深度学习训练时，用相关的数据进行训练会让训练的数据局限于满足一小撮数据，缺少实用性，因此数据间相互独立才能训练出较好的模型。而更多的现实情况是数据之间或多或少存在着相关性，所以深度学习常常选择海量数据来弥补数据间相关产生的训练模型相关。在大批量数据学习中，使用小批量梯度学习是一种比较好的方式，每次选取一小部分数据进行梯参数更新，既能沿着较好的方向更新，又能兼顾训练的效率。另外，还有一种方法可以减弱数据相关性的影响，就是从数据集中随机抽取数据。
pytorch中引入了对数据进行切分分组的机制，下面通过代码说明pytorch如何将数据分成多个batch。

import torch
import torch.utils.data as Data
torch.manual_seed(1)    # reproducible

BATCH_SIZE = 8      # 每个batch的大小，取5或者8

# 生成测试数据
x = torch.linspace(0, 9, 10<

最低0.47元/天解锁文章

XYKenny

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
pytorch：批量数据分割（batch）

深度学习训练时，用相关的数据进行训练会让训练的数据局限于满足一小撮数据，缺少实用性，因此数据间相互独立才能训练出较好的模型。而更多的现实情况是数据之间或多或少存在着相关性，所以深度学习常常选择海量数据来弥补数据间相关产生的训练模型相关。在大批量数据学习中，使用小批量梯度学习是一种比较好的方式，每次选取一小部分数据进行梯参数更新，既能沿着较好的方向更新，又能兼顾训练的效率。另外，还有一种方法可以减弱...
复制链接

扫一扫

专栏目录