深度学习框架预训练模型输入预处理

本文介绍了在计算机视觉任务中,不同深度学习框架如torchvision.models、keras.applications、tensorflow和caffe对预训练模型输入数据的预处理要求,包括图像的通道顺序、尺寸缩放、归一化等步骤。
摘要由CSDN通过智能技术生成

在计算机视觉任务中,我们常常会用到诸如AlexNetVGGResNet等经典的网络结构,为了获得更好的结果并且更快地收敛,通常会使用在imagenet上预训练好的权重。但是,不同深度学习框架提供的预训练权重对于数据的输入有着不同预处理方法。

torchvision.models

torchvision.models包含了使用pytorch预定义好的经典网络结构(比如AlexNetVGGResNet等),并提供了预训练好的权重。其对于输入的要求如下:

  • 输入为3通道RGB图像
  • 缩放到[0,1]区间
  • 使用mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225]进行归一化处理

keras.applications

keras.applications包含了许多预定义好的经典网络结构,并提供使用tensorflowcaffetorch训练好的权重

tensorflow
  • 输入为3通道RGB图像
  • 缩放到[-1,1]区间
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值