从零开始的数字图像处理学习(1)——创世世界的开端

某期末复习

一.图片的基本数据结构

图片内存计算:总字节数 = 宽度 x 高度 x 每个像素的字节数x通道数
在0-255像素图片中:一像素点所占字节为1B

   图片归一化处理为0-1时,像素点数据类型将转变为float:4B

   灰度图片色彩通道数:1

   RGB:3

二.卷积

1.卷积相关概念

什么是卷积:卷积操作是数字图像处理中常用的一种操作,用于图像的滤波、特征提取和图像增强等任务

卷积核(Kernel)或滤波器(Filter):卷积操作使用一个小的矩阵,称为卷积核或滤波器,对图像进行处理。卷积核通常是一个奇数×奇数大小的矩阵,其中的元素称为权重或卷积系数。

卷积运算(Convolution Operation):卷积运算是指将卷积核与图像的每个像素及其周围像素进行点乘(按元素相乘),然后将乘积结果相加得到新的像素值。通过移动卷积核的位置,可以在整个图像上进行卷积运算。

                               g(x, y) = ∑[∑(h(a, b) * f(x - a, y - b))]

   其中,g(x, y)为输出图像的像素值,(x, y)为输出图像中的像素坐标,(a, b)为卷积核h(x, y)中的索引,求和符号∑表示对所有的(a, b)进行求和运算。该公式表示卷积运算的过程是,将卷积核h(x, y)与输入图像f(x, y)的每个像素位置进行对应相乘,然后将所有相乘的结果求和,得到输出图像的像素值。

那么为什么需要进行卷积计算:当我们通过不同卷积操作(使用不同卷积核,filter滤波器)后获得一个新矩阵,即为各种滤波操作获得新图片。

将图片进行卷积操作获得新矩阵,我们不难发现新矩阵尺寸应为:

  • W_out = (W_in - W_k + 2P) / S + 1

  • H_out = (H_in - H_k + 2P) / S + 1

    假设输入图像的尺寸为 W_in × H_in,卷积核的尺寸为 W_k × H_k,步长为 S。其中,W_out 和 H_out 分别表示输出图像的宽度和高度,P 是补零(padding)的大小。

跟输入前图片相比新矩阵将进行压缩,为保持图片尺寸原样输出,我们将进行下面操作。

填充(Padding):填充是在图像周围添加额外的像素,以控制卷积后图像的尺寸。常见的填充方式有零填充(Zero Padding),即在图像周围填充0值像素。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值