【图像卷积与卷积层】的基本概念与区别

图像卷积

卷积操作是指将一个滤波器(也称为卷积核或内核)应用于输入图像的小块区域,然后将滤波器在整个图像上滑动,逐步计算出输出特征图。这个过程可以帮助网络学习到图像的局部特征,因为每个卷积核都可以学习到不同的特征,比如边缘、纹理等。
例如想要平滑以下图像,将原图转化为一个灰度图矩阵 A
待平滑图像
然后用下面这个平均矩阵(说明下,原图的处理实际上用的是正态分布矩阵,这里为了简单,就用了算术平均矩阵)来平滑图像:
g = [ 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 ] g=\left[ \begin{matrix} {1\over 9} & {1\over 9} & {1\over 9} \\ {1\over 9} & {1\over 9} & {1\over 9} \\ {1\over 9} & {1\over 9}&{1\over 9} \end{matrix} \right] g= 919191919191919191
记得刚才说过的算法,把高频信号与周围的数值平均一下就可以平滑山峰。比如我要平滑 a 1 , 1 a_{1,1} a1,1点,就在矩阵中,取出 a 1 , 1 a_{1,1} a1,1点附近的点组成矩阵f,和g进行卷积计算后,再填回去:
取出附近点组成f
f与g做卷积
写成公式就是:(其中i,j在例子中为1)
( f ∗ g ) ( i , j ) = ∑ a ∑ b f ( a , b ) g ( i − a , j − b ) (f*g)(i,j)=\sum_a \sum_b f(a,b)g(i-a,j-b) (fg)(i,j)=abf(a,b)g(ia,jb)
计算 c 4 , 5 c_{4,5} c4,5也是同样的步骤,以此类推计算其他的点,相当于实现了g矩阵在f矩阵上的滑动。

卷积层操作

而在CNN中的卷积层,严格来说其实是互相关运算,而不是卷积运算。卷积层用于进行互相关运算的卷积核是卷积运算中g翻转180度后的矩阵。

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
CNN(Convolutional Neural Network,卷积神经网络)是一种深度学习模型,特别适用于处理具有网格结构的数据,如图像、视频和语音。在CNN中,卷积层是其核心组成部分,它们负责特征提取和局部感知。 卷积层的工作原理主要包括以下几个关键概念: 1. **卷积核(Filter或Kernel)**:是一组可学习的参数,通常是一个小的矩阵。它们会在输入数据上滑动并进行元素相乘,然后求和,生成一个新的特征。这个过程就像一个“滤波器”在寻找输入数据中的特定模式。 2. **权重共享**:同一个卷积核在处理输入的不同位置时,其权重保持不变。这样可以大大减少模型参数数量,提高模型的泛化能力。 3. **激活函数**:如ReLU(Rectified Linear Unit)、Leaky ReLU等,用于引入非线性,增强网络的表达能力。 4. **步长(Stride)**:卷积核移动的步长,决定新特征的尺寸。较大的步长会减少计算量但可能会损失一些信息。 5. **填充(Padding)**:在输入边界添加额外的像素,用于保持输出特征的尺寸不变,或增大输出尺寸。 6. **池化层(Pooling)**:通常紧随卷积层,用于下采样,减小特征的尺寸,进一步减少计算量并增强对空间不变性的鲁棒性。 卷积层的主要作用是通过学习到的特征检测器来识别图像中的边缘、纹理、形状等特征,从而逐步构建对复杂视觉模式的理解。训练完成后,这些特征能够被用于分类、识别等多种计算机视觉任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快苏排序OAO

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值