1.1MNIST数据集
MNIST数据集主要是一些手写的数字的图片及对应标签,该数据集的图片共有10类,对应的阿拉伯数字为0-9;MNIST数据集有两类图像:训练集和测试集
1.2导入数据集
torchvision包主要由3个子包组成,分别是models,datasets和transforms
# 导入数据集
train_loader = torch.utils.data.DataLoader(
datasets.MNIST(root='', # root表示数据加载的相对目录
train=True, # train为True时加载数据库的训练集,为False时加载测试集
download=True, # download表示是否自动下载
transform= transforms.Compose([ # transform表示对数据进行预处理的操作
transforms.ToTensor(), # 把一个取值范围是[0,255]的PIL.Image或者shape为(H,W,C)的numpy.ndarray,
# 转换成形状为[C,H,W],取值范围是[0,1.0]的torch.FloatTensor
transforms.Normalize((0.1307,), (0.3081,)) # 实现归一化,不同数据集中图像通道的均值(mean)和标准差(std)
# 是不一样的
])),
batch_size= 64, # 表示该批次的数据量
shuffle= True # 表示是否洗牌
)
test_loader = torch.utils.data.DataLoader(
datasets.MNIST(root='', # root表示数据加载的相对目录
train=False, # train为True时加载数据库的训练集,为False时加载测试集
transform= transforms.Compose([ # transform表示对数据进行预处理的操作
transforms.ToTensor(),
transforms.Normalize((0.1307,), (0.3081,))
])),
batch_size= 64, # 表示该批次的数据量
shuffle= True # 表示是否洗牌
)
2.1定义神经网络
一个典型的神经网络训练过程包括定义神经网络、前向传播、计算损失、反向传播、更新参数 。torch.nn是专门为神经网络设计的模块化接口,可以用来定义和运行神经网络
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
# 输入图片为单通道,输出为六通道,卷积核大小为5 * 5
self.conv1 = nn.Conv2d(1, 6, 5)
self.conv2 = nn.Conv2d(6, 16, 5)
# 把16 * 4 * 4的Tensor转为一个120维的Tensor,因为后面要通过全连接层
self.fc1 = nn.Linear(16 * 4 * 4, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
# 在(2,2)的窗口上进行池化
x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
x = F.max_pool2d(F.relu(self.conv2(x)), 2) # (2,2)也可以直接写成数字2
x = x.view(-1, self.num_flat_features(x))
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
def num_flat_features(self, x):
size = x.size()[1:]
num_features = 1
for s in size:
num_features *= s
return num_features