pytorch 速度问题测试

我的心永远是冰冰哒

已于 2023-02-27 10:23:37 修改

阅读量321

点赞数

分类专栏： python 文章标签： pytorch 深度学习 python

于 2023-02-18 13:00:15 首次发布

本文链接：https://blog.csdn.net/qq_45759229/article/details/129099074

版权

python 专栏收录该内容

101 篇文章 3 订阅

订阅专栏

今天我发现一个很奇怪的问题，就是我当样本量从200000增加到40万的时候，训练代码没有改动，但是pytorch的速度却突然增加了4倍不止，后面我发现这个速度的问题在于dataloader的创建方式上

如果采用

 myloader = DataLoader(dataset=myset, batch_size=batch_size, shuffle=True)

这个速度就会慢

但是如果采用

myloader = DataLoader(dataset=myset, batch_size=batch_size, shuffle=True,num_workers=4, pin_memory=True)

这个速度就会快2倍差不多，这个就和tensorflow里面的速度差不多了，这个值得注意，有时间可以单独测试一下，这里先记录一下

而且我发现，对于大数据集，尽量不要使用jupyter来跑结果，这个很有可能会出问题，应该直接使用.py来运行，这样不容易出问题的

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我的心永远是冰冰哒

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch 速度问题测试

pytorch速度问题测试
复制链接

扫一扫

专栏目录

解决Pytorch 训练与测试时爆显存(out of memory)的问题

09-18

在使用PyTorch进行深度学习模型的训练和测试过程中，可能会遇到“显存溢出”（Out of Memory，OOM）的问题。这个问题通常是由于GPU内存不足以存储所有计算所需的张量而导致的。以下是一些解决PyTorch训练与测试时...

【PyTorch】使用Torch自带的工具进行性能分析

墨门

09-24

6684

Keywords: Flame FlameGraph Torch.autograd.profiler;

参与评论您还未登录，请先登录后发表或查看评论

A100 显卡算力与pytorch不匹配

weixin_56759664的博客

07-25

588

原因：NVIDIA A100算力不同（架构不同），所以以前可以正常用的pytorch1.9, 换到了这个显卡机器就会报错。

使用Pytorch测试cuda设备的性能（单卡或多卡并行）

梦马韶华

11-17

1837

`CUDA设备`泛指NVIDIA显卡或启用ROCm的AMD显卡（通常叫做仿冒CUDA）使用Pytorch测试cuda设备的性能（单卡或多卡并行）

关于dataloader设置num_works和batchsize最佳方法

hirocyh的博客

05-16

5204

我是参照了这两个大佬的 1.dataloader合理设置num_works和batchsize https://blog.csdn.net/qq_41917697/article/details/114663331 2.Pytorch之DataLoader的num_works参数设置 https://blog.csdn.net/qq_41196472/article/details/106393994?utm_source=app&app_version=4.7.1&code=app_156

【训练加速】优化PyTorch的速度和内存效率（2022）

豆芽菜

10-12

2134

深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下，每个迭代的速度越快，整个模型的预测性能就越快。我收集了几个PyTorch技巧，以最大化内存使用效率和最小化运行时间。为了更好地利用这些技巧，我们还需要理解它们如何以及为什么有效。

pytorch量化测试代码，mobilenetv2在cifar10速度测试

03-31

对于"mobilenetv2在cifar10速度测试"，这表明代码将针对CIFAR-10数据集运行MobileNetV2模型，并对比不同量化方法下的运行速度和精度。总结来说，这些Python文件展示了如何使用PyTorch进行深度学习模型的量化，以...

Pytorch模型训练实用教程

10-03

通过学习这个教程，读者将能够熟练地在PyTorch环境中构建、训练和优化深度学习模型，解决实际问题。此外，教程可能还涵盖了模型的调参技巧、模型融合以及如何利用PyTorch进行迁移学习等进阶主题，帮助开发者不断提升...

YOLOV9的 Pytorch实现

02-26

PSO pytorch代码

热门推荐

一个学习困难症患者的破博客

08-30

1万+

GPU性能的简单测试脚本（pytorch版）

使用 Docker + NVidia 运行 Pytorch 验证 GPU 是否性能高效

ndscvipuser的专栏

03-11

2371

本文主讲体验，方便深入理解为什么 GPU 这么高效，以及相关的对应措施。

Pytorch Mac GPU 训练与测评

weixin_73136678的博客

02-01

3230

今天中午看到Pytorch的官方博客发了Apple M1 芯片 GPU加速的文章，这是我期待了很久的功能，因此很兴奋，立马进行测试，结论是在MNIST上，速度与P100差不多，相比CPU提速1.7倍。当然这只是一个最简单的例子，不能反映大部分情况。这里详细记录操作的一步步流程，如果你也感兴趣，不妨自己上手一试。

pytorch 测量模型运行时间，GPU时间和CPU时间，model.eval()介绍

tony365的博客

05-15

9007

我们知道，在pytorch中，模型有两种模式可以设置，一个是train模式、另一个是eval模式。model.train()的作用是启用 Batch Normalization 和 Dropout。在train模式，Dropout层会按照设定的参数p设置保留激活单元的概率，如keep_prob=0.8，Batch Normalization层会继续计算数据的mean和var并进行更新。model.eval()的作用是不启用 Batch Normalization 和 Dropout。

win10+GTX1050+Pytorch-GPU+pip离线安装心得（克服清华源安装太慢）

qq_43365306的博客

02-05

1547

前言提示：惠普暗影精灵2+win10+GTX1050用conda安装PytorchGPU环境。一、基本认识 conda：一个管理虚拟环境管理安装包的平台，它可以生成一个单独的虚拟环境，可以给一个环境安装单独的包（这里这个包，就是压缩包，拿工具安装就会解压成文件夹，里面的函数，就是平时调用的库，比如平常写 from xx import xx，这里的from就是库。）虚拟环境：可以理解为你的电脑单独开了一个小空间，这块小空间和其他的小空间互不打扰，单独运行程序时，这块小空间所可以依赖的库都是被co.

pytorch 2.0初探：和pytorch 1.13的速度对比

qiumokucao的博客

07-19

3449

通过多次实验对比pytorch1.13和pytorch2.0.1，发现2.0.1比1.13提速8%左右，但是compile没有效果，暂时没搞清楚什么原因。难道是40系显卡还不支持？另外从官方介绍也可以看出，提速效果跟硬件、模型结构都有关系，所以具体能提速多少，还得自己在实际项目中尝试。

pytorch模型调用和速度测试

山中有石为玉

05-30

6684

硬件： 1、测试模型：NIMA的pytorch版本来源：https://github.com/truskovskiyk/nima.pytorch 模型：pretrain-model.pth 速度：平均一张图300ms左右 5.152941832318902 5.508232474792749 4.2969538709148765 5.8256916594691575 5.3...

Pytorch 测试模型的推理速度

Ray Home

04-07

1322

【代码】Pytorch 测试模型的推理速度。

pytorch的gpu测试

12-04

PyTorch是一个流行的深度学习框架，它支持在GPU上进行加速计算。为了测试PyTorch在GPU上的性能，首先需要确保安装了适当的CUDA驱动和cuDNN库。接着，可以使用以下代码来测试在GPU上运行PyTorch的性能： ```python import torch # 检查GPU是否可用 device = torch.device("cuda" if torch.cuda.is_available() else "cpu") # 创建一个大型的随机张量 input_data = torch.rand(1000, 1000, device=device) # 将计算放在GPU上进行 output_data = input_data.mm(input_data) # 输出结果 print(output_data) ``` 运行这段代码后，可以观察到在GPU上进行计算时的速度明显快于在CPU上进行计算的速度。这是因为GPU是专门用于并行计算的硬件，能够同时处理多个任务，适合深度学习中大规模矩阵运算的需求。在实际的深度学习任务中，使用GPU进行加速计算可以大大缩短训练时间，提高模型的训练效率。需要注意的是，为了充分利用GPU的性能，还需要进行一些优化工作，例如使用合适的batch size、选择合适的算法和模型结构等。另外，在使用GPU时也需要考虑到显存的限制，避免出现内存溢出的情况。总之，PyTorch在GPU上的测试表明了它在深度学习任务中的卓越性能和有效性。