imagenet 数据集读取数据速度记录

最新推荐文章于 2024-10-31 17:28:45 发布

qq_30362711

最新推荐文章于 2024-10-31 17:28:45 发布

阅读量1.6k

点赞数 5

分类专栏：神经网络技术

本文链接：https://blog.csdn.net/qq_30362711/article/details/111580846

版权

神经网络技术专栏收录该内容

20 篇文章

订阅专栏

本文通过实验对比不同设置下的PyTorch DataLoader性能，包括调整batch大小、worker数量、使用内存缓存及LMDB等方法，旨在提高大规模图像数据集加载效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

电脑配置是固态硬盘，i7cpu，不进行计算，只读数据，不做数据增广，只做resize

只看不赞不文明，这是大约花费两天时间测试结果

5 [0.1] 0.0 2021-03-20 13:33:20
train_iters::300
train_acc::0.3857
test_acc::0.3256
validation_acc::0.34
9 [0.1] 0.0 2021-03-20 13:38:16
train_iters::600
train_acc::0.2859
test_acc::0.2804
validation_acc::0.313
13 [0.1] 0.0 2021-03-20 13:43:07
train_iters::900
train_acc::0.3087
test_acc::0.2986
validation_acc::0.3354

将workers 从0调为1

5 [0.1] 0.0 2021-03-20 13:54:18
train_iters::300
train_acc::0.3816
test_acc::0.3041
validation_acc::0.3371
9 [0.1] 0.0 2021-03-20 14:00:42
train_iters::600
train_acc::0.1968
test_acc::0.2511
validation_acc::0.2732
13 [0.1] 0.0 2021-03-20 14:07:07
train_iters::900
train_acc::0.3428
test_acc::0.2583
validation_acc::0.3065

将workers 从0调为2

	worker_num=2

    coco_g = coco_data_generater(r'D:\zy\data\coco2017\train2017')

    train_dataset = size_test_dataset(class_name_list, data_index_start_end=[0, train_data_num], coco_g=coco_g)

    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True,
                              num_workers=worker_num, pin_memory=True, drop_last=True, collate_fn=collate)

    test_dataset = size_test_dataset(class_name_list, data_index_start_end=[-1000, None], coco_g=coco_g)

    test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False,
                             num_workers=worker_num, pin_memory=True, drop_last=True, collate_fn=collate)

    validation_dataset = size_test_dataset(class_name_list, data_index_start_end=[-2000, -1000], coco_g=coco_g)

    validation_loader = DataLoader(validation_dataset, batch_size=batch_size, shuffle=False,
                                   num_workers=worker_num, pin_memory=True, drop_last=True, collate_fn=collate)

5 [0.1] 0.0 2021-03-20 14:14:25
train_iters::300
train_acc::0.3842
test_acc::0.2853
validation_acc::0.3175
9 [0.1] 0.0 2021-03-20 14:19:41
train_iters::600
train_acc::0.2561
test_acc::0.272
validation_acc::0.3096
13 [0.1] 0.0 2021-03-20 14:24:56
train_iters::900
train_acc::0.1925
test_acc::0.2467
validation_acc::0.2609

将workers 从0调为4

5 [0.1] 0.0 2021-03-20 14:33:14
train_iters::300
train_acc::0.3858
test_acc::0.3451
validation_acc::0.3766
9 [0.1] 0.0 2021-03-20 14:39:50
train_iters::600
train_acc::0.2448
test_acc::0.265
validation_acc::0.2888
13 [0.1] 0.0 2021-03-20 14:46:28
train_iters::900
train_acc::0.304
test_acc::0.1576
validation_acc::0.1634

不知道为啥，并没有变快啊