计算机视觉与深度学习第五章:图像基础操作

本文按照北京邮电大学计算机学院鲁鹏老师的计算机视觉与深度学习课程按章节进行整理,需要的同学可借此系统学习该课程详尽知识~



一、图像噪声

噪声分类

在这里插入图片描述

二、卷积

卷积定义

在这里插入图片描述

卷积性质

在这里插入图片描述

卷积示例

在这里插入图片描述
锐化解释
在这里插入图片描述

卷积去噪

平均卷积核

在这里插入图片描述
平均卷积核存在的问题及解决方法
在这里插入图片描述

高斯卷积核

在这里插入图片描述

  • 如何设置卷积核尺寸?
    在这里插入图片描述
    大方差或者大尺寸卷积核平滑能力强
    小方差或者小尺寸卷积核平滑能力弱
    经验法则: 将卷积核的半窗宽度设置为 3𝜎,最终卷积模板尺寸为2 × 3𝜎 + 1

  • 如何设置高斯函数的标准差?
    标准差设置成1, 卷积模板宽度=2x3x1 + 1 = 7
    在这里插入图片描述

  • 高斯卷积核可分离性质:可分解为两个一维高斯的乘积
    在这里插入图片描述
    在这里插入图片描述

中值滤波器

在这里插入图片描述
在这里插入图片描述
总结:三种类型的噪声中,椒盐噪声、脉冲噪声建议使用中值滤波器,对于高斯噪声可以使用高斯卷积核来进行去噪。

三、边缘提取

  1. 为什么要研究边缘?
    编码图像中含有大量的语义与形状信息
    相对于像素表示,边缘表示显然更加紧凑
  2. 边缘的种类
    在这里插入图片描述
  3. 边缘检测目标
    在这里插入图片描述

边缘检测

检测图像中亮度明显而急剧变化的地方
在这里插入图片描述
图像求导                    图像偏导                    图像梯度
在这里插入图片描述

噪声影响

在这里插入图片描述

1.平滑

在这里插入图片描述

2.高斯一阶偏导卷积核

在这里插入图片描述
高斯核 vs高斯一阶偏导核
在这里插入图片描述

Canny边缘检测器

1.用高斯一阶偏导核卷积图像

2.计算每个点的梯度幅值和方向

在这里插入图片描述

3.非极大值抑制

在这里插入图片描述

4.连接与阈值(滞后)

在这里插入图片描述
双阈值

  1. 定义两个阈值:低和高
  2. 先使用高阈值开始边缘曲线,使用低阈值继续边缘曲线
    在这里插入图片描述

四、纹理表示

纹理类别

在这里插入图片描述

基于卷积核组的纹理表示方法

  1. 利用卷积核组提取图像中的纹理基
    在这里插入图片描述
  2. 利用卷积核组对图像进行卷积操作获得对应的特征响应图组
    在这里插入图片描述
  3. 利用特征响应图的某种统计信息来表示图像中的纹理。
    在这里插入图片描述
    当我们忽略基元位置,只关注出现了哪种基元对应的纹理以及基元出现的频率时,可以得到如下信息:
    在这里插入图片描述

卷积核组设计

  • 卷积核类型(边缘、条形以及点状)
  • 卷积核尺度(3-6个尺度)
  • 卷积核方向(6个角度)
    在这里插入图片描述

五、图像增强

数据增强:是从现有的训练样本中生成更多的训练数据,其方法是利用多种能够生成可信图像的随机变换来增加样本。
数据增强的目标:模型在训练时不会两次查看完全相同的图像。这让模型能够观察到数据的更多内容,从而具有更好的泛化能力。
在这里插入图片描述


  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值