【笔记】动手学深度学习 - 卷积层

这篇博客介绍了卷积神经网络(CNN)在图片识别和自然语言处理中的应用,强调了平移不变性和局部性两大特性。通过二维卷积运算的示例,解释了卷积层的工作方式,并展示了如何通过梯度下降训练卷积核。文章还提供了一个简单的PyTorch实现,用于演示卷积运算的过程。
摘要由CSDN通过智能技术生成

从全连接到卷积

主要是应用于图片识别,其次还有自然语言处理等。

卷积神经网络不再是对每个输入像素进行处理,而是把图片分成一小块区域来进行处理,这样就加强了图片信息的连续性。加深了神经网络对于图片的理解和识别。

这里卷积部分看的不是特别懂,所以又去看了吴恩达的深度学习视频

视频中的这个式子就是对应吴恩达视频中的这个没有加偏置的效果。其中a,b就是用来限制过滤器的大小的。

计算机视觉的网络结构具有两个性质:

    平移不变性(translation invariance):不管检测对象出现在图像中的哪个位置,神经网络的前面几层应该对相同的图像区域具有相似的反应,即为“平移不变性”。

    局部性(locality):神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔较远区域的关系,这就是“局部性”原则。最终,在后续神经网络,整个图像级别上可以集成这些局部特征用于预测。

 卷积层

这部分可以参考吴恩达深度学习部分

二维相关,通常也可以叫做二维卷积。

输入、核、输出之间的大小关系:

 总结:

1 卷积层就是将输入和核矩阵(过滤器)进行交叉相关,加上偏移后得到输出。

2 核矩阵和偏移是可以学习的参数

3 核矩阵的大小是超参数

代码

这里定义了一个矩阵X

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.],
        [1., 1., 0., 0., 0., 0., 1., 1.]])

我们想要通过卷积出矩阵Y(卷积核为[1,-1]的一个1*2矩阵)

tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.],
        [ 0.,  1.,  0.,  0.,  0., -1.,  0.]])

我们的目的就是通过真实的X,Y(定义好了的)来训练出[1,-1]这样的卷积核:

import torch
from torch import nn
from d2l import torch as d2l

"""卷积运算。"""
def corr2d(X, K):  #X为输入的矩阵,K为过滤器
    h, w = K.shape     #得到过滤器的大小
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))  #定义输出的矩阵,大小由输入矩阵和过滤器的大小决定
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i + h, j:j + w] * K).sum()   #每次从X矩阵中取出一部分和过滤器进行点积然后求和 得到Y[i,j]
    return Y

"""定义网络,网络forward即为对X用K来卷积后加上bias得到Y"""
class Conv2D(nn.Module):
    def __init__(self, kernel_size):
        super().__init__()
        self.weight = nn.Parameter(torch.rand(kernel_size))
        self.bias = nn.Parameter(torch.zeros(1))

    def forward(self, x):
        return corr2d(x, self.weight) + self.bias


"""Y=X用K来卷积"""
X = torch.ones((6, 8))
X[:, 2:6] = 0
print('X:',X)
K = torch.tensor([[1.0, -1.0]])
Y = corr2d(X, K)
print('Y',Y)



# 构造一个二维卷积层,它具有1个输出通道和形状为(1,2)的卷积核
conv2d = nn.Conv2d(1,1, kernel_size=(1, 2), bias=False)

# 这个二维卷积层使用四维输入和输出格式(批量大小、通道、高度、宽度),
# 其中批量大小和通道数都为1
X = X.reshape((1, 1, 6, 8))
Y = Y.reshape((1, 1, 6, 7))

for i in range(10):
    Y_hat = conv2d(X) #输出值为Y_hat
    l = (Y_hat - Y) ** 2 #损失函数
    conv2d.zero_grad() #梯度设为零
    l.sum().backward() 
    # 迭代卷积核
    conv2d.weight.data[:] -= 3e-2 * conv2d.weight.grad  #梯度下降
    if (i + 1) % 2 == 0:
        print(f'batch {i+1}, loss {l.sum():.3f}')

print(conv2d.weight.data.reshape((1, 2)))

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值