在本教程中,您将学习如何使用迁移学习来培训您的网络。
在实践中,很少有人从头开始训练整个卷积网络(使用随机初始化),因为拥有足够大小的数据集是相对少见的。相反,在一个非常大的数据集上预先训练一个卷积神经网络是很常见的(例如,ImageNet,它包含了120万个有1000个类别的图像),然后使用“卷积神经网络”作为初始化或固定的功能提取器来完成感兴趣的任务。
这两种主要的转移学习情景如下:
1)对卷积神经网络的研究:我们用一个预先训练的网络来初始化网络,就像在imagenet 1000数据集上训练的那样。其余的训练看起来和往常一样。
2)在这里,我们将固定所有网络的权重,除了最后全连接层。最后一个全连接层被替换为一个带有随机权重的新层,只有这一层被训练。
# License: BSD
# Author: Sasank Chilamkurthy
from __future__ import print_function, division
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy
plt.ion() # interactive mode
数据加载(LOAD DATA)
我们将使用 torchvision 和 torch.utils.data 两个包来完成数据的加载
我们今天要解决的问题是训练一个模型来分类蚂蚁和蜜蜂。我们为蚂蚁和蜜蜂准备了大约120张训练图片。每个类有75个验证映像。通常,如果从头开始训练,这是一个非常小的数据集。由于我们使用的是转移学习,所以我们应该能够很好地概括。
这个数据集是imagenet的一个非常小的子集。
Download the data from here and extract it to the current directory.