本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~
第五章 图像基础操作
一、图像噪声
噪声分类
二、卷积
卷积定义
卷积性质
卷积示例
锐化解释
卷积去噪
平均卷积核
平均卷积核存在的问题及解决方法
高斯卷积核
-
如何设置卷积核尺寸?
大方差或者大尺寸卷积核平滑能力强
小方差或者小尺寸卷积核平滑能力弱
经验法则: 将卷积核的半窗宽度设置为 3𝜎,最终卷积模板尺寸为2 × 3𝜎 + 1 -
如何设置高斯函数的标准差?
标准差设置成1, 卷积模板宽度=2x3x1 + 1 = 7
-
高斯卷积核可分离性质:可分解为两个一维高斯的乘积
中值滤波器
总结:三种类型的噪声中,椒盐噪声、脉冲噪声建议使用中值滤波器,对于高斯噪声可以使用高斯卷积核来进行去噪。
三、边缘提取
- 为什么要研究边缘?
编码图像中含有大量的语义与形状信息
相对于像素表示,边缘表示显然更加紧凑 - 边缘的种类
- 边缘检测目标
边缘检测
检测图像中亮度明显而急剧变化的地方
图像求导 图像偏导 图像梯度
噪声影响
1.平滑
2.高斯一阶偏导卷积核
高斯核 vs高斯一阶偏导核
Canny边缘检测器
1.用高斯一阶偏导核卷积图像
2.计算每个点的梯度幅值和方向
3.非极大值抑制
4.连接与阈值(滞后)
双阈值
- 定义两个阈值:低和高
- 先使用高阈值开始边缘曲线,使用低阈值继续边缘曲线
四、纹理表示
纹理类别
基于卷积核组的纹理表示方法
- 利用卷积核组提取图像中的纹理基
- 利用卷积核组对图像进行卷积操作获得对应的特征响应图组
- 利用特征响应图的某种统计信息来表示图像中的纹理。
当我们忽略基元位置,只关注出现了哪种基元对应的纹理以及基元出现的频率时,可以得到如下信息:
卷积核组设计
- 卷积核类型(边缘、条形以及点状)
- 卷积核尺度(3-6个尺度)
- 卷积核方向(6个角度)
五、图像增强
数据增强:是从现有的训练样本中生成更多的训练数据,其方法是利用多种能够生成可信图像的随机变换来增加样本。
数据增强的目标:模型在训练时不会两次查看完全相同的图像。这让模型能够观察到数据的更多内容,从而具有更好的泛化能力。