🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎
📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃
🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝
📣系列专栏 - 机器学习【ML】 自然语言处理【NLP】 深度学习【DL】
🖍foreword
✔说明⇢本人讲解主要包括Python、机器学习(ML)、深度学习(DL)、自然语言处理(NLP)等内容。
如果你对这个系列感兴趣的话,可以关注订阅哟👋
卷积神经网络(Convolutional Neural Network, CNN)
CNN 是一种前馈神经网络,通常由一个或多个卷积层(Convolutional Layer)和全连接层(Fully Connected Layer,对应经典的 NN)组成,此外也会包括池化层(Pooling Layer)。
CNN 的结构使得它易于利用输入数据的二维结构。
注意:前馈神经网络(Feedforward NN)指每个神经元只与前一层的神经元相连,数据从前向后单向传播的 NN。其内部结构不会形成有向环(对比后面要讲到的 RNN/LSTM)。 它是最早被发明的简单 NN 类型,前面讲到的 NN、DNN 都是前馈神经网络。
每个卷积层由若干卷积单元组成——可以想象成经典 NN 的神经元,只不过激活函数变成了卷积运算。
卷积运算是有其严格的数学定义的。不过在 CNN 的应用中,卷积运算的形式是数学中卷积定义的一个特例,它的目的是提取输入的不同特征。
一般情况下,从直观角度来看,CNN 的卷积运算,就是下图这样:
上图中左侧的蓝色大矩阵表示输入数据,在蓝色大矩阵上不断运动的绿色小矩阵叫做卷积核,每次卷积核运动到一个位置,它的每个元素就与其覆盖的输入数据对应元素相乘求积,然后再将整个卷积核内求积的结果累加,结果填注到右侧红色小矩阵中。 卷积核横向每次平移一列,纵向每次平移一行。最后将输入数据矩阵完全覆盖后,生成完整的红色小矩阵就是卷积运算的结果。
CNN 经常被用于处理图像,那么对应的输入数据就是一张图片的像素信息。
对于这样的输入数据,第一层卷积层可能只能提取一些低级的特征,如边缘、线条、角等,更多层的网络再从低级特征中迭代提取更复杂的特征。
CNN 结构相对简单,可以使用反向传播算法进行训练,这使它成为了一种颇具吸引力的深度学习网络模型。
除了图像处理,CNN 也会被应用到语音、文本处理等其他领域。
卷积神经网络Pytorch的实现
-
import torch
-
import torch.nn
as nn
-
import torchvision
-
import torchvision.transforms
as transforms
-
-
-
# 设备配置
-
device
= torch.device(
'cuda:0'
if torch.cuda.
is_available()
else
'cpu')
-
-
# 超参数
-
num_epochs
=
5
-
num_classes
=
10
-
batch_
size
=
100
-
learning_rate
=
0.001
-
-
# MNIST 数据集
-
train_dataset
= torchvision.datasets.MNIST(root
=
'../../data/',
-
train
=
True,
-
transform
=transforms.ToTensor(),
-
download
=
True)
-
-
test_dataset
= torchvision.datasets.MNIST(root
=
'../../data/',
-
train
=
False,
-
transform
=transforms.ToTensor())
-
-
# 数据加载器
-
train_loader
= torch.utils.
data.DataLoader(dataset
=train_dataset,
-
batch_
size
=batch_
size,
-
shuffle
=
True)
-
-
test_loader
= torch.utils.
data.DataLoader(dataset
=
test_dataset,
-
batch_
size
=batch_
size,
-
shuffle
=
False)
-
-
# 卷积神经网络(两个卷积层)
-
class ConvNet(nn.Module):
-
def __init__(
self, num_classes
=
10):
-
super(ConvNet,
self).__init__()
-
self.layer
1
= nn.
Sequential(
-
nn.Conv
2d(
1,
16, kernel_
size
=
5, stride
=
1, padding
=
2),
-
nn.BatchNorm
2d(
16),
-
nn.ReLU(),
-
nn.MaxPool
2d(kernel_
size
=
2, stride
=
2))
-
self.layer
2
= nn.
Sequential(
-
nn.Conv
2d(
16,
32, kernel_
size
=
5, stride
=
1, padding
=
2),
-
nn.BatchNorm
2d(
32),
-
nn.ReLU(),
-
nn.MaxPool
2d(kernel_
size
=
2, stride
=
2))
-
self.fc
= nn.Linear(
7
*
7
*
32, num_classes)
-
-
def forward(
self, x):
-
out
=
self.layer
1(x)
-
out
=
self.layer
2(out)
-
out
= out.reshape(out.
size(
0), -
1)
-
out
=
self.fc(out)
-
return out
-
-
model
= ConvNet(num_classes).
to(device)
-
-
# 损失和优化器
-
criterion
= nn.CrossEntropyLoss()
-
optimizer
= torch.optim.Adam(model.parameters(), lr
=learning_rate)
-
-
# 训练模型
-
total_step
= len(train_loader)
-
for epoch
in range(num_epochs):
-
for i, (images, labels)
in enumerate(train_loader):
-
images
= images.
to(device)
-
labels
= labels.
to(device)
-
-
# 前向传播
-
outputs
= model(images)
-
loss
= criterion(outputs, labels)
-
-
# 向后优化
-
optimizer.
zero_grad()
-
loss.backward()
-
optimizer.step()
-
-
if (i
+
1) %
100
=
=
0:
-
print (
'Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
-
.
format(epoch
+
1, num_epochs, i
+
1, total_step, loss.item()))
-
-
# 测试模型
-
model.eval() # eval
mode (batchnorm uses moving mean
/variance instead
of mini-batch mean
/variance)
-
with torch.
no_grad():
-
correct
=
0
-
total
=
0
-
for images, labels
in
test_loader:
-
images
= images.
to(device)
-
labels
= labels.
to(device)
-
outputs
= model(images)
-
_, predicted
= torch.max(outputs.
data,
1)
-
total
+
= labels.
size(
0)
-
correct
+
= (predicted
=
= labels).
sum().item()
-
-
print(
'Test Accuracy of the model on the 10000 test images: {} %'.
format(
100
* correct
/ total))
-
-
# 保存模型
-
torch.save(model.state_dict(),
'model.ckpt')