图像预处理

1. 图像数据的挑战

视角变化:将一张图像经过旋转、对称变换后,模型是否还能正确识别出
在这里插入图片描述
光照变化:光线的明暗,灯光的位置
在这里插入图片描述
尺度变化: 一个 物体缩小或放大在这里插入图片描述形态变换:同一物体,但不同姿态
在这里插入图片描述
背景混淆干扰:具有相同花色的不同物体
在这里插入图片描述
遮挡情况
在这里插入图片描述
类内物体的外观差异
在这里插入图片描述

2. 图像预处理

图像预处理包含:

  1. 图像显示与存储原理
  2. 图像增强的目标
  3. 点运算:基于直方图的对比度增强
  4. 形态学处理
  5. 空间域处理、卷积
  6. 卷积的应用(平滑、边缘检测、锐化等)
  7. 频率域处理:傅里叶变换、小波变换

2.1 图像显示

2.1.1 RGB颜色空间

RGB颜色空间:加法混合、彩色显示器;包含3个通道:Red通道、Green通道、Blue通道。一个像素颜色值:(b,g,r)。取值范围有两种:[0, 255]和[0.0, 1.0]
在这里插入图片描述

2.1.2 CMY(K)颜色空间

CMY(K)颜色空间:减法混色、印刷;包含4个通道:Cyan通道、Magenta通道、yellow通道、key通道;一个像素颜色值(c, m, y, k);取值范围:[0, 255]和[0.0, 1.0]
在这里插入图片描述

2.1.3 HSY颜色空间

HSY颜色空间为:人类视觉概念、画家配色;包含3个通道:H/Hue(色调、颜色种类)、S/Saturation(饱和度,颜色 的纯度)、V/Value(明度、颜色明亮度);一个像素颜色值为(h, s, v);取值范围:[0, 255]和[0.0, 1.0]
在这里插入图片描述

2.2 图片存储原理

  1. 主流颜色空间为RGB三通道彩色图,将图片分为三维矩阵
    在这里插入图片描述
  2. 单通道灰度图:亮度信息为[0, 255],和RGB颜色空间有如下的转换方式: G r a y = R ∗ 0.3 + G ∗ 0.59 + B ∗ 0.11 Gray = R * 0.3 + G * 0.59 + B * 0.11 Gray=R0.3+G0.59+B0.11
    在这里插入图片描述
  3. 常见的存储格式有:
    在这里插入图片描述

2.3 图像增强的目标

  1. 改善图像的视觉效果
  2. 转换为更适合人或机器分析处理的形式
  3. 突出对人或机器分析有意义的信息
  4. 抑制无用信息,提高图像的使用价值

操作有:图像锐化、平滑、去噪、灰度调整(对比度增强)
在这里插入图片描述

2.3.1 空域分析及其变换

滤波/卷积:在每个图片位置 ( x , y ) (x, y) (x,y)上进行基于领域的函数计算。

滤波函数 → \to 权重相加,包含卷积核(卷积模板);滤波器(滤波模板);扫描窗
h [ x , y ] = ∑ k , l f [ k , l ] I [ x + k , y + l ] h[x, y] = \sum_{k, l} f[k, l] I[x + k, y + l] h[x,y]=k,lf[k,l]I[x+k,y+l]
其中: h [ x , y ] h[x, y] h[x,y]为滤波结果; f [ k , l ] f[k, l] f[k,l]为滤波函数,即卷积核中在 ( k , l ) (k, l) (k,l)上的权重参数; I [ x + k , y + l ] I[x + k, y + l] I[x+k,y+l]为像素领域值,即与 f [ k , l ] f[k, l] f[k,l]相对应的图片像素值; x , y x, y xy为像素在图片中的位置/坐标; k , l k, l k,l为卷积核中的位置/坐标(卷积核的中心点坐标为 ( 0 , 0 ) (0, 0) (0,0)
在这里插入图片描述
边界填充(padding):可获得同尺寸输出。
边界填充类型有:补零、边界复制、镜像、块复制。
不同功能需要的定义不同的函数:

  1. 平滑/去噪
  2. 梯度/锐化
  3. 边缘、显著点、纹理
  4. 模式检测

平滑 中值滤波/卷积:奇数尺寸的卷积核(33,55, 77,2n1 * 2n-1)
即将卷积域内的像素值从小到大排序,并取中间值作为卷积输出。平滑中值滤波/卷积可有效去除椒盐噪声
在这里插入图片描述
平滑 高斯滤波/卷积:采用奇数尺寸的卷积核,模拟人眼只关注中心区域,可有效去除高斯噪声。
G σ = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 G_\sigma = \frac{1}{2 \pi \sigma^2} e^{-\frac{x^2 + y^2}{2 \sigma^2}} Gσ=2πσ21e2σ2x2+y2
在这里插入图片描述
分解特性:级联高斯。将2D卷积拆分成两个相同的1D卷积:行卷积、列卷积。
作用:降低计算量,1D卷积只进行2K次计算,而2D卷积需要进行K*K次计算。
G σ = 1 2 π σ 2 e − x 2 + y 2 2 σ 2 = ( 1 2 π σ e − x 2 2 σ 2 ) ( 1 2 π σ e − y 2 2 σ 2 ) G_\sigma = \frac{1}{2 \pi \sigma^2} e^{-\frac{x^2 + y^2}{2 \sigma^2}} = (\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{x^2}{2 \sigma^2}})(\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{y^2}{2 \sigma^2}}) Gσ=2πσ21e2σ2x2+y2=(2π σ1e2σ2x2)(2π σ1e2σ2y2)

梯度 Prewitt滤波/卷积

  1. 水平梯度/垂直边缘
    在这里插入图片描述
  2. 垂直梯度/水平边缘
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    laplacian滤波的条件:卷积核中所有参数相加后为0

2.3.2 频域分析及其变换

在这里插入图片描述

高斯金字塔:先进行图像平滑,再进行降采样;根据降采样率,得到一系列尺度逐渐减小的图像。
操作:n次(高斯卷积 → \to 2倍降采样) → \to n层金字塔
目的:捕捉不同尺寸的物体
在这里插入图片描述
高斯金字塔本质为信号的多尺度表示法

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值