PyTorch DataLoader Num_workers-深度学习限速提升(pytorch系列-29)

最新推荐文章于 2024-07-30 08:43:22 发布

peacefairy

最新推荐文章于 2024-07-30 08:43:22 发布

阅读量7.6k

点赞数 16

分类专栏： Pytorch系列文章标签：神经网络 python

本文链接：https://blog.csdn.net/peacefairy/article/details/108015095

版权

Pytorch系列专栏收录该内容

11 篇文章 12 订阅

订阅专栏

PyTorch DataLoader num_workers Test - 加快速度

欢迎来到本期神经网络编程系列。在本集中，我们将看到如何利用PyTorch DataLoader类的多进程功能来加快神经网络训练过程。
在这里插入图片描述

加快训练进程

为了加快训练过程，我们将利用DataLoader类的num_workers可选属性。

num_workers属性告诉DataLoader实例要使用多少个子进程进行数据加载。默认情况下，num_workers值被设置为0，0值代表告诉加载器在主进程内部加载数据。

这意味着训练进程将在主进程内部依次工作。在训练过程中使用一批批处理之后，我们从磁盘上读取另一批批处理数据。

现在，如果我们有一个工作进程，我们可以利用我们的机器有多个内核这一事实。这意味着，在主进程准备好另一个批处理的时候，下一个批处理已经可以加载并准备好了。这就是速度提升的原因。批批处理使用附加的辅助进程加载，并在内存中排队。

Num_workers属性的最优值。

随之而来的问题是，我们应该添加多少个工作进程？这里有很多因素可以影响最佳数量，因此最好的方法就是测试。

Num_workers 属性的测试值

为了设置这个测试，我们将创建一个num_workers值的列表来尝试。我们将尝试以下值:

0 (default)
1
2
4
8
16

对于这些值，我们将通过尝试以下值来改变批次大小。

100
1000
10000

对于学习率，我们将在所有的运行中保持在0.01的恒定值。
最后要提到的是，这里的设置是-我们只为每个运行做一个单一的epoch。
好了，让我们看看我们得到了什么。

不同的`num_workers`值。结果:

好了，我们可以看到下面的结果。我们总共完成了十八次运行。我们有三组不同的批量大小，在每个组中，我们改变了工作进程的数量。

params = OrderedDict(
    lr = [.01]
    ,batch_size = [100,1000,10000]
    ,num_workers = [0,1,2,4,8,16]
    #,shuffle = [True, False]
)
m = RunManager()

for run in RunBuilder.get_runs(params):
    network = Network()
    loader = DataLoader(train_set,batch_size = run.batch_size,num_workers = run.num_workers)
    optimizer = optim.Adam(network.parameters(),lr = run.lr)
    
    m.begin_run(run,network,loader)
    for epoch in range(1):
        m.begin_epoch()
        for batch in loader:
            
            images,labels = batch #get batch
            preds = network(images)#pass batch
            loss = F.cross_entropy(preds,labels) #calculate loss
            optimizer.zero_grad() #zero gradients
            loss.backward() #calculate gradients
            optimizer.step() # update weights
            
            m.track_loss(loss)
            m.track_num_correct(preds,labels)
            
        m.end_epoch()
    m.end_run()
m.save('results')

在这里插入图片描述
从这些结果中得到的主要结论是，在所有三个批次规模中，除了主流程外，拥有一个单一的工作流程可使速度提高约百分之二十。
此外，在第一个流程之后增加额外的工作流程并没有真正显示出任何进一步的改进。