最近对图像识别比较感兴趣,于是就去查阅了相关的资料,发现了特别适用于图像识别领域的神经网络:卷积神CNN)。看着别人的科普,做了一些笔记。
CNN基本原理
典型的 CNN 由3个部分构成:
- 卷积层:提取图像中的局部特征
- 池化层:大幅降低参数量级(降维)
- 全连接层:类似传统神经网络的部分,用来输出想要的结果。
举个例子:用pytorch猫狗识别
class Net(nn.Module):
def __init__(self):
super(Net,self).__init__()
self.conv1 = nn.Conv2d(3,6,5)
self.pool = nn.MaxPool2d(2,2)
self.conv2 = nn.Conv2d(6,16,5)
self.fc1 = nn.Linear(16 * 18 * 18,800)
self.fc2 = nn.Linear(800,120)
self.fc3 = nn.Linear(120,2)
def forward(self,x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1,16 * 18 * 18)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))