简单例子
先说模型搭建,后面发布模型训练,最后模型预测(分类)
import torch.nn as nn
import torch.nn.functional as F
class LeNet(nn.Module):
def __init__(self):
super(LeNet, self).__init__()
self.conv1 = nn.Conv2d(3, 16, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(16, 32, 5)
self.pool = nn.MaxPool2d(2, 2)
self.fc1 = nn.Linear(32 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = F.relu(self.conv1(x))
x = self.pool1(x)
x = F.relu(self.conv2(x))
x = self.pool2(x)
x = x.view(-1, 32 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
定义网络层
1.分析第一层:Conv2d(3,16,5)
in_channel:输入彩色为3
out_channel:卷积核个数(一般与层数相同)
kernel_size:卷积核大小
stride=1
padding=0
self.conv1 = nn.Conv2d(3, 6, 5)
16个卷积核,大小尺寸为:5×5
W:32
F:5
P:0
S:1
卷积后输出矩阵大小:N=28,依然是16个卷积核
2.下采样层MaxPool2d(2, 2)
池化层只改变高和宽(缩小为原来一半14),不改变深度(16)。
3.Conv2d(16, 32, 5)
此时深度为:16
使用32个卷积核,尺寸为5×5
进行计算:
W(输入图片大小):14
F(卷积核大小):5
卷积后的矩阵尺寸大小:N=10,output(32,10,10)
4.下采样层
同样操作:矩阵大小(10)进行缩小一半(5),不改变深度(32)
output(32,5,5)
5.全连接层
Linear(32 * 5 * 5, 120)
对特征矩阵(32,5,5)进行展平操作为一维向量:
第一个全连接层输入个数:3255,节点个数设为120
Linear(120, 84)
第一个节点数120,所以第二个的输入为120,设输出节点个数为84
Linear(84, 10)
最后一个,输入84,输出十种,设为10.