torch dataloader 数据并行_Pytorch数据加载的分析

最新推荐文章于 2023-09-08 12:38:45 发布

weixin_39895096

最新推荐文章于 2023-09-08 12:38:45 发布

阅读量1.6k

点赞数 3

文章标签： torch dataloader 数据并行一个大图切成几个小图加载速度更快

Pytorch数据加载的效率一直让人头痛，此前我介绍过两个方法，实际使用后数据加载的速度还是不够快，我陆续做了一些尝试，这里做个简单的总结和分析。

1、定位问题

在优化数据加载前，应该先确定是否需要优化数据加载。数据读取并不需要更快，够快就好。一般的，显存占用率很高，利用率却很低的时候，通常会怀疑是数据加载太慢导致，但不是唯一原因，比如模型内大量的循环也会导致GPU利用率低。可以尝试固定数据看看是否可以提高GPU利用率。

确定数据加载需优化后，需要判断是数据加载的哪一部分慢。整个数据处理的流程如下：

为节省阅读时间，先给结论，数据加载慢主要是由于计算性能的瓶颈，而不是IO瓶颈和数据拷贝瓶颈（测试数据为1920x1080的大图，小图片可能结论不同）。为优化加载速度应该从两个方向下手：

下面是具体的实验分析，测试环境和数据如下：

2. Baseline

不进行任何额外优化下的速度如下：

其中：

可以明显的看出耗时主要发生在数据读取和数据增强部分，而CPU到GPU的数据转换等耗时较少。

需要注意的一个地方是【crop(8960x540)、转GPU、归一化】和【转GPU、归一化】的耗时差不多，crop的耗时很小，且crop后图片较小，使得转GPU的操作也变快了，最终二者的耗时差不多。

分析将分为以下几个部分： DataLoader 图片读取 * 数据增强

此外由于【CPU转GPU、数据的归一化转秩】和【DataLoader】比较相关，会一起分析。

(1) num_workers

最低0.47元/天解锁文章

关注