某期末复习
一.图片的基本数据结构
图片内存计算:总字节数 = 宽度 x 高度 x 每个像素的字节数x通道数
在0-255像素图片中:一像素点所占字节为1B
图片归一化处理为0-1时,像素点数据类型将转变为float:4B
灰度图片色彩通道数:1
RGB:3
二.卷积
1.卷积相关概念
什么是卷积:卷积操作是数字图像处理中常用的一种操作,用于图像的滤波、特征提取和图像增强等任务
卷积核(Kernel)或滤波器(Filter):卷积操作使用一个小的矩阵,称为卷积核或滤波器,对图像进行处理。卷积核通常是一个奇数×奇数大小的矩阵,其中的元素称为权重或卷积系数。
卷积运算(Convolution Operation):卷积运算是指将卷积核与图像的每个像素及其周围像素进行点乘(按元素相乘),然后将乘积结果相加得到新的像素值。通过移动卷积核的位置,可以在整个图像上进行卷积运算。
g(x, y) = ∑[∑(h(a, b) * f(x - a, y - b))]
其中,g(x, y)为输出图像的像素值,(x, y)为输出图像中的像素坐标,(a, b)为卷积核h(x, y)中的索引,求和符号∑表示对所有的(a, b)进行求和运算。该公式表示卷积运算的过程是,将卷积核h(x, y)与输入图像f(x, y)的每个像素位置进行对应相乘,然后将所有相乘的结果求和,得到输出图像的像素值。
那么为什么需要进行卷积计算:当我们通过不同卷积操作(使用不同卷积核,filter滤波器)后获得一个新矩阵,即为各种滤波操作获得新图片。
将图片进行卷积操作获得新矩阵,我们不难发现新矩阵尺寸应为:
-
W_out = (W_in - W_k + 2P) / S + 1
-
H_out = (H_in - H_k + 2P) / S + 1
假设输入图像的尺寸为 W_in × H_in,卷积核的尺寸为 W_k × H_k,步长为 S。其中,W_out 和 H_out 分别表示输出图像的宽度和高度,P 是补零(padding)的大小。
跟输入前图片相比新矩阵将进行压缩,为保持图片尺寸原样输出,我们将进行下面操作。
填充(Padding):填充是在图像周围添加额外的像素,以控制卷积后图像的尺寸。常见的填充方式有零填充(Zero Padding),即在图像周围填充0值像素。