在计算机视觉任务中,我们常常会用到诸如AlexNet
、VGG
、ResNet
等经典的网络结构,为了获得更好的结果并且更快地收敛,通常会使用在imagenet
上预训练好的权重。但是,不同深度学习框架提供的预训练权重对于数据的输入有着不同预处理方法。
torchvision.models
torchvision.models
包含了使用pytorch
预定义好的经典网络结构(比如AlexNet
、VGG
、ResNet
等),并提供了预训练好的权重。其对于输入的要求如下:
- 输入为
3
通道RGB
图像 - 缩放到
[0,1]
区间 - 使用
mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225]
进行归一化处理
keras.applications
keras.applications
包含了许多预定义好的经典网络结构,并提供使用tensorflow
、caffe
、torch
训练好的权重
tensorflow
- 输入为
3
通道RGB
图像 - 缩放到
[-1,1]
区间