课程笔记

一、introduction and digital images

1、 颜色:人类视觉的心理生理特征,下图是维基百科对颜色的解释。

 

2、三色原理:能用三色表示任何可见的颜色

如下图所示,白线对应的值越高,表明人眼对此波段的光子的感知越灵敏。

人眼把S那条线感受到的光子都认知为蓝色、把M那天线的认知为绿色、把L那天线对应的认知为红色。红、绿和蓝(RGB)就是三原色。这三种颜色相当于三维空间里的三个坐标,红绿蓝分别为三个基矢量,可以组成一个三维线性空间(如下图所示), 每个颜色就是这个空间中的某个点,也就是说,其他颜色是红绿蓝三色的线性组合,

 

由于RGB没有颜色亮度和色度的信息,即某种颜色需要某个系数为负数 才能获得。因此,使用RGB的变化XYZ来表示。

XYZ空间要满足一些约束:

  1. 所有坐标都是正的保持等能点作为白点
  2. Y坐标代表明度
  3. Z坐标在红光段保持为0
  4. 所有色彩尽可能充满新的空间

 

 

二、basic image processing

1、图像处理的目的--人类视觉、机器视觉、技术所需、娱乐

2、图像的亮度修正

亮度直方图(如下图所示),理想的亮度直方图中间高两边矮。

亮度的线性修正

 

3、卷积---操作如下图所示

  • 锐化----将图像的边缘加到原来的图像上,强化图像的边缘使其锐化。锐化滤波器了,也就是在边缘检测滤波器的基础上,再在中心的位置加1,这样滤波后的图像就会和原始的图像具有同样的亮度了,但是会更加锐利。主要用来强调图像的细节。如下图所示。

 

 

 

  • 边缘检测

 

 

  • 浮雕滤波器----给图像一种3D的效果

 

下图中,A:原图,B:锐化,C:边缘检测,D:浮雕

  • 图像平滑 image smoothing: 压制、弱化或消除图像中的细节、突变、边缘和噪声,就是图像平滑化。

 

4、边缘检测 --- canny 算子

图片中颜色的快速变化为高频信息,颜色的平缓变化为低频信息。

canny算法是一种multi-stage 的算法,其处理图片的过程分为如下五个步骤:

1. Noise Reduction(去噪处理)

边缘检测过程中需要检测的图片边缘属于高频信息。而图片中噪声部分也属于高频信息,因此我们需要对图像进行去噪处理。常用的是使用5*5的高斯滤波核来平滑图像,滤波核的数量呈高斯分布。

2. Finding Intensity Gradient of the Image(图像的梯度和方向)

计算像素梯度的幅值以及方向,常用的算子有Rober,sobel,计算水平及垂直方向的差分。找出梯度较大的区域,这部分区域属于图像增强的区域,此时得到的边缘信息比较粗大。

3.Non-Maximun Suppression(非最大值抑制)

非极大值抑制属于一种边缘细化的方法,梯度大的位置有可能为边缘,在这些位置沿着梯度方向,找到像素点的局部最大值,并将非最大值抑制。

4.Double Threhold(双阈值)

双阀值方法,设置一个maxval,以及minval,梯度大于maxval则为强边缘,梯度值介于maxval与minval则为弱边缘点,小于minval为抑制点。

5.Edge tracking by hysteresis

滞后边缘追踪,主要处理梯度值位于maxval,minval中的一些像素点。由于边缘是连续的,因此可以认为弱边缘如果为真实边缘则和强边缘是联通的,可由此判断其是否为真实边缘。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值