为啥训练速度慢(一)

最近训练时,数据集比较大,读取数据需要花费好长好长的时间,一直找不到原因,现在终于找了的!!!
是因为我在做测试的时候,怕图片文件路存在,加了个文件路径存在判断,但是后来忘了删除掉,,这个真的超级费时间!
背景:

  1. 数据只读前5000条,即只有50张图片;
  2. 同一批数据,读10次,计算每次读取时间;

1)这个是加了路径判断之后,记录每一次的读取时间:

for i in range(24): # 同一批数据读24次
    time_t.tic()
    with open(self.list_dir) as f2:
        lines2 = f2.readlines()
        for idx,line2 in enumerate(lines2):
            if idx <50:
                items2 = line2.strip().split()
                filename, label = items2[0], int(items2[1])
                filename = osp.join(self.root_dir, filename)
				if not os.path.exists(filename):
    				print("====file {} not exit=====".format(filename))
    				samples2.append((filename, label))
    t1 = time_t.toc()
    print("==={}==={}".format(i,t1), len(samples2))
print("===final===",len(samples2))

在这里插入图片描述

2)去除图片路径判断之后,读取时间:
在这里插入图片描述
对比可以发现,加了路径判断真的是超级慢,能慢几十倍不止啊,实际场景中可能需要百万甚至千万的数据读取训练,真的好费时间,emmm…以后不要把这种测试代码,搞到最后啊!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值