19 卷积层 [动手学深度学习v2]

最新推荐文章于 2024-10-12 15:19:31 发布

Grin*

最新推荐文章于 2024-10-12 15:19:31 发布

阅读量460

点赞数

分类专栏：跟李沐学AI 文章标签：人工智能 pytorch 卷积

本文链接：https://blog.csdn.net/gpx33333/article/details/121589150

版权

跟李沐学AI 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

该博客探讨了图像处理中两个关键原则——平移不变性和局部性，并解释了如何将这些原则应用于全连接层以设计卷积层。通过限制权重和应用局部约束，实现了2维卷积运算，这在图像模式识别中至关重要。此外，还介绍了卷积层与交叉相关运算的区别，并提供了Python实现的示例。

摘要由CSDN通过智能技术生成

两个原则：
- 平移不变性
- 局部性
这两个在图片里面找模式的原则启发了之后的设计。
重新考察全连接层
1. 将输入和输出变形为矩阵（宽度，高度）
2. 将权重变形为4-D张量：（ $h$ , $w$ ）到（ $h^{'}$ , $w^{'}$ ）
  $h_{i, j}=\sum_{k, l} w_{i, j, k, l} x_{k, l}=\sum_{a, b} v_{i, j, a, b} x_{i+a, j+b}$
  $V$ 是 $W$ 的重新索引： $v_{i, j, a, b}=w_{i, j, i+a, j+b}$
原则 #1 - 平移不变性
- $x$ 的平移导致 $h$ 的平移： $h_{i, j}=\sum_{a, b} v_{i, j, a, b} x_{i+a, j+b}$
- $v$ 不应该依赖于（ $i$ , $j$ ）[（ $a$ , $b$ ）可以看作是我们要识别的东西]
- 解决方案：加一个限制， $v_{i,j,a,b} = v_{a,b}$
  $h_{i, j}=\sum_{a, b} v_{a, b} x_{i+a, j+b}$
  这就是2维卷积（交叉相关）
原则 #2 - 局部性
- 当评估 $h_{i,j}$ 时，我们不应该用远离 $x_{i,j}$ 的参数
- 解决方案：当 $\Delta$ 时，使得 $v_{a,b} = 0$
  $h_{i, j}=\sum_{a=-\Delta}^{\Delta} \sum_{b=-\Delta}^{\Delta} v_{a, b} x_{i+a, j+b}$
对全连接层使用平移不变性和局部性得到卷积层
$h_{i, j}=\sum_{a, b} v_{i, j, a, b} x_{i+a, j+b} \quad \rightarrow \quad h_{i, j}=\sum_{a=-\Delta}^{\Delta} \sum_{b=-\Delta}^{\Delta} v_{a, b} x_{i+a, j+b}$
交叉相关 vs 卷积
- 二维交叉相关
  $y_{i, j}=\sum_{a=1}^{h} \sum_{b=1}^{w} w_{a, b} x_{i+a, j+b}$
- 二维卷积
  $y_{i, j}=\sum_{a=1}^{h} \sum_{b=1}^{w} w_{-a, -b} x_{i+a, j+b}$
- 由于对称性，在实际使用中没有区别
卷积层将输入和核矩阵进行交叉相关，加上偏移后得到输出；核矩阵和偏移是可学习的参数；核矩阵的大小是超参数（局部性）。

互相关运算

import torch

def corr2d(X, K):
    """计算二维互相关运算"""
    h, w = K.shape
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i:i + h, j:j + w] * K).sum()
     return Y