菜品分类与检索大作业踩坑

1.训练速度

keras坑很多

训练网络时,以下会不同程度上影响速度:

1)imagedatagenerator,如果进行数据增强

2)图片尺寸

3)model.fit。虽然model.fit也支持generator,但速度比fit_generator慢很多

以下不一定能提升训练速度

1)multi_gpu_model:https://github.com/keras-team/keras/issues/9204

2)多卡+大batchsize:batchsize大小对训练速度的影响_Golden-sun的博客-CSDN博客_batchsize越大训练越快吗

3)网络中trainable参数个数

2.显存不够

如果数据集太大,会报OOM错误

减小batchsize效果不明显

可将flow改成flow_from_directory,同时注意train、val的类别与对应label

keras flow from directory显示label index_Learning from the mistakes-CSDN博客

也可以将keras预训练的resnet50的trainable设置成false,但此时需要用transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])将输入图片归一化,因为imagenet数据集输入是0-1【不知道是不是这样,但设置成false后不归一化是肯定不行的。按理来说如果设成True,那么即使不归一化resnet50权重也会去适应数据】

model = multi_gpu_model(model, gpus=4)后model层数、权重等都会改变,此时使用model.summary()会发现很多层不见了。之后save、loadweights时,也需要使用multi_gpu_model(model, gpus=4)

由于imagenet是-1~1,0为中心的,所以用imagedatagenerator时要用预处理函数直接rescale比较好

另外用resnet50的preprocess_input和utils的preprocess_input是不一样的,自己查.目前的建议是用的哪个预训练模型,就用哪个模型的preprocess_input。此外,用预训练模型,不需要rescale=1/255

内存不够,无法一下子将test集读进来。用test_generator,shuffle需设置成false,否则test样本顺序不对。bs=1.此外,文件顺序用generator.filename

此外,用pandas生成csv时,人工检查下csv里各列的顺序和list里的顺序是否相同

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值