机器视觉总结

图像技术基础

图像的数字化包含哪些步骤?简述这些步骤。
图像的数字化主要包含采样、量化两个过程。采样是将空域上连续的图像变换成离散采样点集合,是对空间的离散化。经过采样之后得到的二维离散信号的最小单位是像素。量化就是把采样点上表示亮暗信息的连续量离散化后,用数值表示出来,是对亮度大小的离散化。经过采样和量化后,数字图像可以用整数阵列的形式来描述。

1. 图像和像素

1,图是客观存在,像是人的感觉,图像是二者的有机结合,对客观存在物体的一种相似性的生动模仿或描述。
2,灰度图像、彩色图像(RGB)均是数字图像的范畴。数字图像的二维元素(位置,幅值)称为像素。
3,图像像素点的存储矩阵与线代中矩阵的区别:
(1)图象中的值为整数
(2)数据量大

2. 像素间联系*

1,像素的邻域,4-邻域、对角邻域 N D ( P ) N_{D}(P) ND(P)、8-邻域N_{8}§
例4-邻域: N 4 ( P ) N_{4}(P) N4(P)

r
rPr
r

2,连通性,描述区域和边界的重要概念。两个必要条件:两像素位置相邻+灰度值满足特定的相似性准则(相等)。
与邻域位置相对应,有4-连通、8-连通、m连通(4-连通和D连通的混合连通)
m连通的判断
对于灰度值在v集合中的像素点p,q。若q在 N 4 ( P ) N_{4}(P) N4(P) N D ( P ) N_{D}(P) ND(P)中,且 N 4 ( P ) N_{4}(P) N4(P) N 4 ( q ) N_{4}(q) N4(q)无交集(没有灰度值在V集合中的像素点)Ps:下图中红色块表示在V集合中。
在这里插入图片描述
3,像素间距离,两个像素间的距离总是正的。
两个像素p,q,坐标(x,y),(s,t)
(1)欧式距离: D E ( p , q ) = [ ( x − s ) 2 + ( y − t ) 2 ] D_{E}(p,q)=\sqrt{[(x-s)^{2}+(y-t)^{2}]} DE(p,q)=[(xs)2+(yt)2]
(2)城区距离: D 4 ( p , q ) = ∣ x − s ∣ + ∣ y − t ∣ D_{4}(p,q)=|x-s|+|y-t| D4(p,q)=xs+yt
(3)棋盘距离: D 8 ( p , q ) = m a x ( ∣ x − s ∣ , ∣ y − t ∣ ) D_{8}(p,q)=max(|x-s|,|y-t|) D8(p,q)=max(xs,yt)
用城区距离定义4-邻域: N 4 ( P ) N_{4}(P) N4(P) = {r | D 4 ( p , r ) = 1 D_{4}(p,r) =1 D4(p,r)=1}
用棋盘距离定义8-邻域: N 8 ( P ) N_{8}(P) N8(P) = {r | D 8 ( p , r ) = 1 D_{8}(p,r) =1 D8(p,r)=1}

3. 采样和量化*

1,图像的数字化过程:采样 —> 量化 —> 编码
采样:空间坐标数字化
量化:灰度值数字换即幅度值离散化
编码:用二进制表示
2,空间分辨率和幅度分辨率

4. 图像存储与格式*

1,图像大小: 2 m ∗ 2 n ∗ 2 k ( b i t ) 2^{m}*2^{n}*2^{k} (bit) 2m2n2k(bit)
2,位图与矢量图的区别

分类位图(光栅形式)图像矢量图(矢量形式)图形
表示由像素组成,定义像素颜色用矢量表示图的轮廓,用数学公式描述所包含的图形形状
放大失真、模糊依然清晰

5. 图像显示与技术*

1,半调(Halftone)输出
一种将灰度图像转化为二值图像的技术。模板的调制很重要。
在这里插入图片描述
2,抖动技术
为了补充由于半调输出技术造成的灰度级数有限的确定,随机加入一些点使得图像的质量更好。
3,对比度:是指一幅图像中灰度反差的大小,最大灰度 / 最小亮度

6. 图像的坐标变换

在这里插入图片描述

7. 图像技术及分类*

图像技术及分类
在这里插入图片描述

图像增强技术**

在这里插入图片描述

1,算术和逻辑运算

算术运算
加法可通过求平均值得方法去噪;加性、乘性、椒盐、量化噪声等。
减法可用于去除背景信息、检测运动物体、检测图像间的差异
乘法可用于去除图像中部分影像
除法,多光谱遥感运算的比值计算
逻辑运算
补、与、或

2,图像灰度映射

直接灰度映射
图像求反
对比度拉伸
动态范围压缩

3,直方图均衡化**

直方图:横坐标是灰度级,纵坐标是灰度级出现的频率。
频率计算公式: p ( r k ) = n k / n p(r_{k})=n_{k}/n p(rk)=nk/n
图像的明亮反差等视觉效果和直方图具有较为直接的对应关系。
直方图均衡化
借助直方图变换实现灰度级映射
在这里插入图片描述
理解:
1.第三步骤的公式: g k = ∑ i = 0 k n i n = ∑ i = 0 k p ( r i ) g_{k}= \sum_{i=0}^k \frac{n_i}{n} = \sum_{i=0}^k p(r_{i}) gk=i=0knni=i=0kp(ri)
2.第四步骤中的 L 是指灰度级总数,该例题中 L = 8
3.第五步骤的映射关系:A —> B
由A找到原始直方图中的频率值 对应写到 B 灰度级下方的直方图频率值方格中

4,直方图规定化**

直方图规定化
通过将原始图的直方图转换为期望的直方图,从而达到预期的目标。(有参照的靠近
在这里插入图片描述
理解:
1, 步骤7确定映射灰度级时,应先看V2的值从而推导到V1的值,通过这个思路来确定。
2, 映射关系与上图的直方图均衡化有异曲同工之处。

5,空域卷积增强

平滑:模糊,消除噪声;
锐化:增强被模糊的细节
线性平滑滤波 模板尺寸越大,图像越模糊,图像细节丢失越多。
邻域平均(下图为其常见模板)M=9
在这里插入图片描述
在这里插入图片描述
加权平均 M=16
在这里插入图片描述
非线性平滑滤波
中值滤波器 (模板无值,只是确定位置
线性锐化滤波
突出图像中的细节或者增强被模糊了的细节。
模板要求:中心系数为正值,外围为负值,系数之和为0。
在这里插入图片描述
效果分析:
常数或变化平缓的区域,结果为0或很小,图像很暗,亮度被降低了
在暗的背景上边缘被增强了
图像的整体对比度降低了
计算时会出现负值,需要进行尺度变换处理
问题:增强了边的同时,丢失了图像的层次和亮度。
解决方法,高频提升滤波,即把原始图与放大的系数A相乘再减去平滑图。
非线性锐化滤波

图像编码技术

图像编码基本原理是什么?数字图像的冗余表现有哪几种表现形式?
答:虽然表示图像需要大量的数据,但图像数据是高度相关的,或者说存在冗余(Redundancy)信息,去掉这些冗余信息后可以有效压缩图像,同时又不会损害图像的有效信息。
数字图像的冗余主要表现为以下几种形式:空间冗余、时间冗余、视觉冗余、信息嫡冗余、结构冗余和知识冗余。

1.数据冗余和压缩

1,,冗余数据:数据表达了无用的信息或者表达了已经表达的信息。
在这里插入图片描述
2,解码器和编码器
在这里插入图片描述
3,图像压缩方法
在这里插入图片描述

2,图像保真度

描述解码图像相对于原始图像的偏离程度,是对信息损失的测度。

3,哈夫曼编码的原理及实现过程

基本思想:通过减少编码冗余来达到压缩的目的,统计一下符号的出现概率然后建立一个概率统计表:将最常出现(概率大的)的符号用最短的编码;最少出现的符号用最长的编码
哈夫曼编码过程
(1)将信源符号按概率递减顺序排列;
(2)把二个最小概率相加作为新符号的概率,并按仍按概率递减顺序排列;
(3)重复(1)、(2),直到概率为1;
(4)在每次合并信源时,将合并的信源分别赋“o”和“1”(如概率大的赋“o”,概率小的赋“1”);
(5)写出每一符号的“1”、“0”序列(丛树根到信源符号节点)。
例题:
在这里插入图片描述
哈夫曼编码是一种变长编码,是消除编码冗余的常用方法。哈夫曼编码的编码过程包括两个步骤:信源消减和符号赋值。信源消减过程中将信源符号逐步合并到只剩两个,以根据二进制赋值。符号赋值过程中逐步展开合并的符号,将码字从短到长赋给出现频率从大到小的信源符号。

4,算术编码的原理及实现过程

它是一种非分组编码算法。它是从全序列出发,采用递推形式的连续编码。
它不是将单个的信源符号映射成一个码字,而是将整个输入序列的符号依据它们的概率映射为实数轴上区间[01)内的一个小区间,再在该小区间内选择一个代表性的二进制小数,作为实际的编码输出。

5,无损预测、有损预测和变换编码的原理

预测编码是通过直接在图像空间中消除像素间冗余来实现数据压缩的方法,它的基本思路是仅对像素真实值和预测值的差进行编码,由于这个差的动态范围比原始像素值的动态范围小,所以可用较少的数据量表示,从而取得压缩效果。如果将每个差值全部送到解码端,可以完全恢复原始图像,此时称为无损预测编码。预测值常采用对先前像素值线性组合的方法来获得,最简单的就是只利用前值(m=1)进行预测。
有损预测基本思想:
对无损预测压缩的误差进行量化,通过消除视觉心理冗余,达到对图像进一步压缩的目的。
有损预测编码通过将预测误差映射进有限个输出以提高压缩效率,但同时也导致了失真,即在解码端不能完整恢复原始图像。具体实现有损预测编码时,需要在编码端加入量化器。量化器导致的有损预测编码的典型失真现象包括颗粒噪声和斜率过载,它们分别导致图像中目标边缘发生模糊和整个图像产生纹状表面。影响有损预测编码性能的两个重要因素是预测和量化,一般希望在均方误差意义下达到最优。
变换编码:是通过正交变换把图像从空间域转化为能量比较集中的变换域系数,然后对变换系数经行编码,从而达到压缩数据的目的。

6,几种颜色空间

实际应用中常用的颜色空间很多,有RGB、HSV 、HSI 、YUV、YIQ 等。目前常
用的颜色空间可分为两类,一类是面向硬设备的,比方说彩色显示器、打印机等,另一类面
向以彩色处理为目的的应用,面向硬设备的最常用的颜色空间是RGB颜色空间,而面向颜
色处理的最常用颜色空间是HSI 颜色空间以及HSV 颜色空间。针对不同的应用目的采用不
同的彩色空间可能更合适,因此,有时需要将一种颜色数据表示形式转换为另一种形式。
80. 由三基色混配各种颜色通常有两种方法:相加混色法和相减混色法。相加混色和相
减混色的主要区别表现在以下三个方面:
(1 )相加混色是由发光体发出的光相加而产生的各种颜色,而相减混色是先有白色光,
然后从中减去某些成份(吸收)得到各种颜色。
(2 )相加混色的三基色是红、绿、蓝,而相减混色的三基色是黄、青、品红。也就是
16说,相加混色的补色就是相减混色的基色。
(3 )相加混色和相减混色有不同的规律。
彩色电视机显示的颜色是通过相加混色产生的。而彩色电影和幻灯片等与绘画原料、打
印机打印图片等是通过相减混色产生各种颜色的。

  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小威程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值