首发于
编程技术
写文章
登录
数字图像处理
水dong方块
水dong方块
1 人赞同了该文章
主观题
大题拉普拉斯滤波器好像是每年必考,空域和频域的转换,这个参考课后题用傅里叶变化的性质。 今年还考了一个ADI如何得到没有运动物体的背景图(没有认真看哭了)。 另外主成分分析也是喜欢考的,会考均方误差(等于没有算进去的特征值的和)
一、直方图均衡 给出8灰度级图像灰度分布频率,求: 1.直方图均衡的计算步骤 2.画出直方图 3.说明图像对比度和直方图之间的关系 4.举例说明直方图在图像分割中的应用
二、 给定模板 T=[-1 -1 -1;-1 9 -1;-1 -1 -1],求 1.记图像为f(x,y),求用模板T在空间域处理后的图像g(x,y)的表达式。 2.求该模板对应的h(x,y) 3.求H(u,v) 4.该模板滤波效果与在实际中的应用情况举例 三、用某工业相机拍摄一堆苹果的灰度图像 1.如果成像过程中,被0均值9方差噪声污染,如何去噪 2.被10%胡椒、10%盐粒噪声污染,如何去噪 3.被周期干扰,如何去除,去噪参数如何确定。 4.现考虑图像内容为一堆香蕉,成像过程中由于镜头缺陷发生了退化,退化可以用某H模拟(H已给出),问复原方式,该复原方式有什么缺陷 5.如何克服上述缺陷
四、形态学 一张简单图像,四个结构元,只涉及膨胀、腐蚀、开操作,注意非对称结构元即可。
五、霍夫变换 1.直线的法线方程与斜截式方程的参数对应关系
2.图像为一个正方形,正方形的四角和中心共五个点12345,给出霍夫空间的五条正弦曲线abcde,求对应关系;求五条正弦曲线中某几条的几个交点的精确坐标。
3.在图像上标出了另一个点,画出其霍夫变换曲线
六、 1.黄光照射到青色物体上,看到什么颜色 2.RGB转HSI 3.忘了 4.忘了
5.主分量压缩:给出6个特征值,在只保留2个的情况下,计算解码图像与原图像之间的均方误差
六、3、 物体30像素x30像素,13帧,沿东北方向匀速直线运动了60√2,求速度 4、物体红色,问能否利用计算机通过某种算法提取出背景,剔除物体(大概是这么个意思?
19年
一、直方图均衡 给出8灰度级图像灰度分布频率,
求: 1.直方图均衡的计算步骤
每一级的概率求和
求累计分布函数. ni/n求和 x L-1, 四舍五入取整 ,同一级的合并.
2.画出直方图
3.说明图像对比度和直方图之间的关系
均衡后的直方图跨越了更宽的灰度范围,增强了对比度
4.举例说明直方图在图像分割中的应用
灰度阈值分割
Otsu)算法
确定最佳阈值,使背景和目标之间的类间方差最大(因为二者差异最大)
二、 给定模板 T=[-1 -1 -1;-1 9 -1;-1 -1 -1],求
1.记图像为f(x,y),求用模板T在空间域处理后的图像g(x,y)的表达式。
加权求和
2.求该模板对应的h(x,y)
3.求H(u,v)
4.该模板滤波效果与在实际中的应用情况举例
高频增强模板,可以复原背景特性并保持锐化效果
锐化处理主要目的是突出图像中的细节或者增强被模糊了的细节
除了能够增强图像边缘外,还具有平滑噪声的优点。 用在边缘提取, 孤立点检测.
三、用某工业相机拍摄一堆苹果的灰度图像
1.如果成像过程中,被0均值9方差噪声污染,如何去噪
处理信号的放大电路会引入热噪声——电子噪声 一般可看作为零均值高斯白噪声。因此只要知道标准差就可完全表征
几何均值滤波器.
2.被10%胡椒、10%盐粒噪声污染,如何去噪
Q =1.5 逆谐波均值滤波 胡椒
Q =-1.5 逆谐波均值滤波 盐粒
3.被周期干扰,如何去除,去噪参数如何确定。
周期噪声是在图像获取期间由 电力或机电干扰产生的,是一 种空间相关噪声。
• 空间正弦噪声对应于傅里叶谱中的共轭脉冲。 频率域滤波来去除. 周期干扰,典型的周期干扰的参数可通过对频谱图的分析来估计 有时也可直接在受污染的图像上推断干扰的周期特性
4.现考虑图像内容为一堆香蕉,成像过程中由于镜头缺陷发生了退化,退化可以用某H模拟(H已给出),问复原方式,该复原方式有什么缺陷
逆滤波
缺陷不能准确还原, 因为噪声函数未知,
在huv 接近 0 处 , 噪声很大, 病态性.
逆滤波, 缺点1 不知道噪声函数不能准确的复原, 2 退化函数很小, 噪声项可能很大, 病态性,
5.如何克服上述缺陷
限制滤波的频率, 接近原点.
四、形态学 一张简单图像,四个结构元,
只涉及膨胀、腐蚀、开操作,
注意非对称结构元即可。
五、霍夫变换
1.直线的法线方程与斜截式方程的参数对应关系
$$
xcos\theta + y sin\theta = p
然后 y = ax+ b
$$
2.图像为一个正方形,正方形的四角和中心共五个点12345,给出霍夫空间的五条正弦曲线abcde,求对应关系;
求五条正弦曲线中某几条的几个交点的精确坐标。
交点代表在图像中点的共同曲线.
3.在图像上标出了另一个点,画出其霍夫变换曲线
六、 1.黄光照射到青色物体上,看到什么颜色
绿+ 红 +白 -红= 绿+ 白 = 绿
2.RGB转HSI
3、 物体30像素x30像素,13帧,沿东北方向匀速直线运动了60√2,求速度
4、物体红色,问能否利用计算机通过某种算法提取出背景,剔除物体(大概是这么个意思?
用ADI
5.主分量压缩:给出6个特征值,在只保留2个的情况下,计算解码图像与原图像之间的均方误差
等于舍去的特征值之和
20年题型分布:
153单选,54多选,101.5判断,210简答(题目乱序、选项乱序)
简答1:类似书上4.27 题目是 给5 x 5 空间模板, 平均与点最近的12个邻点, 不包括该点本身.
a 频率中等价的滤波器
b 证明是低通滤波器.
为了看出这是一个低通滤波器,它有助于以我们熟悉的中心函数的形式表达前面的方程: H(u,v)= 1 2 [cos(2π[u −M/2])/M)+cos (2π[v -N/2]/N)]。为方便起见,考虑一个变量。 当 u 的范围从 0 到 M− 1 时,cos(2π[u −M/2]/M) 的值从 -1 开始,当 u = M/2(滤波器的中心)时在 1 处达到峰值,然后减小 当 u = M 时再次变为 -1。因此,我们看到滤波器的幅度随着距中心滤波器原点的距离而减小,这是低通滤波器的特性。 当同时考虑两个变量时,很容易进行类似的论证。
(1)给定3*3滤波器,求f(x,y)g(x,y)关系
就加权相乘
(2)求H(u,v)
用傅里叶变换对
(3)滤波器特点、举例说明
低通滤波, 因为 在 0 到m-1
简答2:考察ADI、主分量描绘
(1)求运动速度,注意除以的帧数为相差的帧数
(2)如何得到静止的彩色背景图
在正ADI停止变化那一帧的图像中复制之前初始帧中占据的区域, 粘贴到挖去物体的图像中, 恢复该区域的背景.
(3)一道简单的主分量描绘题,记住均方误差公式
特征值之和
客观: 1、一阶导数、二阶导数区别
2、Prewitt、Roberts等算子区别
3、Canny检测步骤
4、基于阈值处理的分割中影响波谷特性的因素
5、ADI特点
6、傅里叶描绘子
设边界上有N个点,按逆时针方向,坐标依次为(xk,yk), k=0,1,…,N-1,我们将其表示成复数形式:
然后离散傅立叶变换, 得到su, 叫做边界的傅里叶描述, 反变换可以得到边界的坐标.
如果只利用傅立叶描述的前P个值,即舍去边界上的高频成分,则是对边界的近似.
7、两个一维高斯类,最佳决策平面
两个类出现的概率相等, w1= w2 = 1/2
决策边界是 P(x0/w1)= P( x0/w2) 的x0值. w1 概率大, x0左移.
相当于决策平面朝概率小的移动,就是先验概率大的决策域更大
8、Bayes意义下,最小距离分类器最佳条件
三个
9、美颜相机所用算法
平滑滤波, 算术均值滤波
10、一种颜色照在另一种颜色物体上,看到什么颜色
三原色, 三补色
11、DFT采用什么填充
零填充
12、去除黑椒噪声Q取值
1.5
13、同时存在高斯噪声、椒盐噪声所用滤波器
修正的α 均值滤波器
14、摄像机运动散焦、逆滤波出问题,怎么办
限制滤波的频率, 接近原点降低遇到0 的概率.
15、直方图均衡特点
范围更宽, 对比度变大
16、人眼视锥细胞特点
锥 亮, 杆暗, 0 峰值, 20° 盲点
17、对数变换的图像增强
对数变换用于压缩像素值较大的图像的动态范围
18、空域滤波器、频域滤波器区别
-
空间滤波可以实现非线性滤波, 频率域不行.
-
空域卷积 = 频域乘法
-
频域fft计算优势
19、傅里叶切
一个图像某方向投影的傅里叶变换就是该图像的二维傅里叶变换在该 方向的一个切片
重建
• 直接傅里叶反变换重建 • 在不同的θ角得到许多投影 • 得到频域的许多切片 • 得到信号的频域表示F(u,v) • 恢复实际信号f(x,y)
• 应用时: • 对获得的投影Pθ(t),进行离散Fourier变换,即得到F(ω,θ) • 再通过内插产生F(u,v) • 利用DFT得到二维图像阵列
• 重建结果同样存在模糊
20、均值滤波器用时、采用什么方法对边界像素扩展
零填充
镜像填充
复制填充
21、开闭操作
1.开操作和闭操作的特点 开:先腐蚀再膨胀。去掉⽐结构元⼩的斑点突刺,切断细⻓搭接,起分离作⽤ 闭:先膨胀再腐蚀。把⽐结构元⼩的缺⼝或孔填上,搭接短的间隙⽽起到连通作⽤。
22、CIE ppt第六章第六页
国际照明委员会
23、RGB
大题拉普拉斯滤波器好像是每年必考,空域和频域的转换,这个参考课后题用傅里叶变化的性质。 今年还考了一个ADI如何得到没有运动物体的背景图(没有认真看哭了)。
另外主成分分析也是喜欢考的,会考均方误差(等于没有算进去的特征值的和
数字图像处理
第二章答案:https://www.wenku365.com/p-21613642.html
重要内容:灰度变换, 空间滤波,频率滤波,图像分割。图像复原。图像增强。 lab : 安装openCV csdnhttps://blog.csdn.net/qq_41175905/article/details/80560429
class1
需要用到的知识: 深度补全, 目标检测,语义分割。 What are we introduce in this class? 对抖动建模, 得到传递函数, 逆变换,图像复原。 image shadow rebuild : skull CT layer image. image process. math shape multicolor image division . we can get a outline of . How to deliver or describe this image? image match and recognition. we need to distinguish this image. frequency filter. It requires more experienced students. The basic concept, application, constitute of image process. 感光相机获得模拟图像。数码相机获得数字图像。
韦伯比: 低照度, 韦伯比大。 two phenomenon show that the peception of light isn’t a simple strength function。 the first one called 马赫带 the second one named 同时对比
灰度
动态范围: 最大可度量灰度/ 最小灰度 灰度用8bit就可以。 灰度级下降会出现伪轮廓。 plenty of details only need fewer 灰度, 大量细节只需要较少的灰度级就可以获得近似的图像感受。 2级量化, 32像素, 32 1024个bit
空间分辨率。 dpi,每英寸多少个dot
第二节课
图像内插 • 内插是图像放大、收缩、旋转和几何校正等任务中广泛使用的 基本工具。是一种基本的图像重取样方法。 • 是用已知数据来估计未知位置的数值的处理 这里有第一个小编程作业
降采样, 比方说把两行给变成一行 取两行中的平均值 原图像, 删去一样的行数和列数,
内插就把它放大 然后把空的那些给取最近/4个最近邻/16个最近邻
图像内插 1• 最近邻内插 , 最简单的, 把原图像中最近邻的灰度赋给每个内插的新位置。 2• 双线性内插(用4个最近邻) 这是最常用的 ,形成一个连续的灰度曲面。得到一个比较光滑的。 • V(x,y)=ax+by+cxy+d f(R1) v(0,0) v(0,1) v(1,0) v(x,y) 注意:实质上是一 种非线性内插方法 3 双三次内插(用16个最近邻,保持细节更好)
project 1
我先用 https://blog.csdn.net/xuan_zizizi/article/details/82747729?utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control&dist_request_id=1328680.21672.16162090095774175&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control 但是这个 双三次插值效果不如二次插值, 和最近邻差不多 . 行不通. 改成这个试试. //https://blog.csdn.net/qq_29058565/article/details/52769497
2.5 像素间的基本关系 p 的 4 邻 域 N 4 ( p ) − − p 的 8 邻 域 N 8 ( p ) − − p 的 4 个 对 角 近 邻 像 素 记 为 N D ( p ) p的4邻域 N_4(p) -- p的8邻域 N_8(p)-- p的4个对角近邻像素记为N_D(p) p的4邻域N4(p)−−p的8邻域N8(p)−−p的4个对角近邻像素记为ND(p) 邻接性 • 相同性质的像素相邻——称它们是邻接的 • 设像素p和r有相同的性质,定义如下3种连接: • (1)4-连接:r在N4( p )中,则p和r为4-邻接; • (2)8-连接:r在N8( p )中,则p和r为8-邻接; • (3)m-连接(混合连接) 若r和p满足 • r在N4 ( p )中 ,或r在ND( p )中,且 p 与 r 没有共同的4连接像素 -> 则称r和p是m-邻接的。 $$ mix混合邻接,即:要么4邻接,要么对角邻接,都 有的话,只算4邻接通路,为了 使计算通路长度时有唯一性。
连通性 • 若两个具有相同性质的像素能找到两两邻接的一条通路, 则称它们是连通的 • 连通关系是一种等价关系 • 对称性; • 传递性。 • 集合中的每个像素都与自身连通
通路与闭合通路
• 如果图像中的一个像素subset S的全部像素之间存在着一个通路path, 则称S是连通的,构成一个连通集connected set,或者称为一个区域。Let R represent a subset of pixels in an image. We call R a region • 连通区域与边界(边界定义为与区域R的补集中的点邻接 Two regions, Ri and Rj are said to be adjacent if their union forms a connected set. Regions that are not adjacent are said to be disjoint 4- path, 8 -path, m - path 混合路径, 就是里面的元素是m-邻接的。 connected : connected component 连通分量 - 外边界对应于背景边界 - 很多算法为了保证形成一个闭合通路,通常采用外边界
边缘与边界
• 边缘 • 边缘由某些具有超过预先设定阈值的导数值的像素形成,是局部概念 • 灰度不连续的像素连接而成 • 边界 • 一个(分割后)有限区域的边界形成一条闭合通路,是整体的概念。
像素间距离
• 像素间距离 • 距离函数须满足三个条件: • D(p,q)>=0,(D(p,q)=0 iff p=q) 非负性; • D(p,q)=D(q,p) 对称性; • D(p,r)<=D(p,q)+D(q,r) 相当于三角形的二边之和大于第三边。 • 常用的欧氏(Euclidean)距离 • 也可用其它形式的距离 • D4(city-block)距离: D4(p,q)=|x-s|+|y-t| • D8(棋盘,chessboard)距离: D8(p,q) = max(|x-s| , |y-t|)
课后习题2.16 把1 像素宽(thick)的 m - path - > 4-path • 线性与非线性操作——图像处理方法最主要的分类之一 如果H是个线性算子,f和g 是两个图像, a和b是两个标量, 那么,H(af + bg) = a H(f)+ b H(g). • 线性满足加性和同质性 • 线性操作具有很大应用价值,但也存在很多非线性操作,如两个差分绝对值算子, 最大算子,中值 滤波,最小算子…… 对K个图像求和的算子, 求平均是线性的。
课后2.22 , 一个子图的和, Sxy 等式2-43是一个线性操作吗?
2.26 常数乘以随机变量的方差等于常数平方乘以随机变量的方差。 (2)不相关的随机变量之和的方差等于各个随机变量的方差的总和。 2.28 图像减法在工业应用中经常被用来检测产品装配中的缺失零件。方法是存储一个对应于正确装配的“金色”图像;然后从同一产品的传入图像中减去该图像。理想情况下,如果新产品装配正确,差异将为零。缺少组件的产品的差异图像在与金色图像不同的区域将不为零。你认为这种方法在实践中必须满足什么条件才能起作用?
算术操作
• 针对降噪的带噪图像相加平均 图像相减用于增强差别 使用图像相乘或相除来校正阴影 利用模版相乘做ROI提取操作,region of interest 感兴趣区域。
图像算数操作中的归一化
算术操作后会出现很多负值以及超出原图灰度范围的灰度值, 需要归一化 当处理8bit图像时,K=255
灰度图像的集合操作 • 由空间相应元素对间的最大灰度形成的阵列 第10章 , 灰度图像的形态学处理。
空间操作 • 包含三类:单像素操作、邻域操作、集合空间变换 • 单像素操作 邻域操作: 邻域范围加权求平均。 滑动窗口,
图像配准
• 几何空间变换和图像配准 • 几何变换由两个基本操作组成 • 坐标的空间变换 然后• 灰度内插 • 常用的几何空间变换——仿射变换affine transformation of coordinates,可以保持直线平行。ppt 60页有例子图 图像旋转和灰度内插 通常采用逆映射的方法插值。 作业 课后2.37 高斯消元法是最经典也是最广为人知的一种矩阵求逆方法(考试或者手算会用到) 高斯消元法先将矩阵A与单位矩阵I进行连接形成一个新的增广矩阵. (a) * Find the inverse scaling transformation.
(b) Find the inverse translation transformation. x’ = x + t1 , y ’ = y + t2
© Find the inverse vertical and horizontal shearing transformations. x’ = x + sy , y ’ = y
(d) * Find the inverse rotation transformation.
(e) * Show a composite inverse translation/rotation transformation. 混合变换
图像配准 • 用于对其两幅或者多幅相同或者相似场景的图像,是图像处 理的一种重要应用; • 主要问题是需要估计两幅图像之间的几何变换函数; • 通常采用约束点(或者特征点)对应的方法求取。
向量与矩阵操作 • 1 彩色图像可以看做是三维向量,多光谱图像则维数更高 • 2. 整幅图像可以看做矩阵或者向量来处理。把尺寸为M×N的图 像描述为一个MN×1维向量来处理,如线性处理。
处理一千万的像素, 因此对算力要求很高。
很多时候,除了空间域,在图像的变换域做处理会更好。
• 正变换: • 反变换: 变换举例 • 变换核可分 • 变换核对称 • 傅里叶变换
概率方法在图像处理中应用广泛。最基本的方式是以随机量来 处理灰度值。 • 将图像看成为是一个随机场,可以获得很多相关的统计量。如:
第三章 灰度变换和空间滤波
空间域处理: 灰度变换:
空间滤波:
灰度变换
直接灰度变换:
线性灰度变换 如果是8bits, 最大灰度范围 0到255, g(x,y) = 255[f(x,y)-a]/(b-a) f(x,y) 是原来的灰度函数,就是位置和灰度的关系. 作业要会求变换.
分段线性灰度变换: 对比度拉伸, 阈值处理。
灰度倒置变换:s= L - 1 - r 或g(x,y) =L-1 -f(x,y) 暗区的细节转换到亮区。
对数变换: 暗区快速提高对比度, 亮区压缩对比度。 压缩像素值较大的图像的动态范围。
幂律γ变换: 具有局部动态范围的压缩或者放大功能; γ越小, 低对比区提升约明显。 想一想: 为什么这样就变强了? 因为指数大于1 和小于1 起到的作用相反.
灰度层分级
比特平面分层: 存储四个高阶bit平面就可以重建。 比特是怎么分出来的?
什么是高阶什么是低阶?
3.3 直方图
rk 表示 每一级的密度, h(rk) = nk , nk是第rk级的像素个数.M and N are the number of image rows and columns,. The sum of p (rk ) for all values of k is always 1. 直方图,每个灰度出现的频率。 直方图均衡, 积累分布函数。
我们假设 (a)T (r)是区间0≤r≤ L-1的单调递增函数; 并且 (b)值域和自变量域对应 (a)中T (r)单调增加的条件保证了输出强度值永远不会小于相应的输入值,从而防止了强度反转产生的伪影artifacts。 条件(b)确保输出强度的范围与输入的范围相同。
如果每一灰度级都有像素 ,那么T®就是严格递增的. 就可以有逆变换 r = T-1(s) 灰度离散下的直方图均衡
均衡后的直方图跨越了更宽的灰度范围, 增强了对比度。 偏暗的, 小灰度像素多, 高灰度像素少, 均衡后变成亮一些。 作业: 如果我们将低阶位平面设置为零,则对直方图会有什么影响? 图像会很亮, 对比度会变小. 如果我们将高阶位平面设置为零,则对直方图会有什么影响? 重要的细节都丢失了, 图像会很暗,对比度会变小.
直方图规定化
rk 直方图均衡 -》 sk vl 直方图均衡 -》 zl
不能一一对应得到指定直方图的 zl。 因为多个zl对应同一 vl 。
要强制对应单映射 single。 sml
什么是直方图映射? 怎么找直方图映射函数?
直方图是离散, 没法标准均匀分布。 为什么离散直方图均衡技术通常不能产生flat的直方图? 因为这是概率密度函数possibilities distribution function的近似,不能和均匀直方图一模一样. 我们没有重新分配像素强度, 只是重新映射了每个灰度级. 直方图均衡化所做的只是在强度等级上重新映射直方图分量。 为了获得均匀的直方图,通常需要实际重新分配像素强度,以便有L组n = L个像素具有相同的强度,其中L是允许的离散强度级别的数量,n是总数 输入图像中的像素数。 直方图均衡方法对此类型的(人工)重新分配过程没有任何规定。 不能实现完全均匀。
跨越了更宽的灰度范围,每个灰度级概率密度更加均匀.
直方图规定化example 累积分布函数的映射. 0.19 找到 0.2 最接近。 0.2 对应3 。 所以 rk 为 0 时映射到3。 1的 累积分布是0.44 对应 3 4 都可以, 选择灰度变化最小的, 所以选择 3 。 2 的累积分布 0.65 ,
规定的直方图可能比均衡的直方图更好 ppt p42
直方图规定化和均衡化有什么区别?
均衡化是把 规定化是 让直方图变成规定的形状, 不一定平均分布.
局部直方图处理
把图像中每个像素的领域中的灰度分布为基础设计变换函数。
n阶矩 2阶矩
两种计算方法都可以
基于直方图的局部增强
三张图, 一个,第二个全图直方图增强,第三个部分增强, ppt 45页 大家都比较黑, 有东西的就是方差较大的, 比纯背景方差大, 方差在一个范围内挑出来, 然后灰度放大e 倍。
没有太多复杂的数学公式 很多时候靠观察和图像的理解, 可以用更简单的方式优化
3.4 空间滤波基础
线性空间滤波和频率滤波 是一一对应的。 空间滤波还可以 非线性滤波, 这是频率域做不到的。
相关 , 直接乘 卷积, 翻转后乘
为什么要用可分离的卷积? 51页。 减小计算量。 怎么确定可分离卷积核?52页
什么样的是可分离的? 是唯一的模板是可分离的。 rank =1 是可分离的. 在 a box kernel all rows and columns are identical, the rank of these kernels is 1, which, as we discussed earlier, means that they are separable.
空间滤波和 频率域滤波的区别?
什么是振铃? sinc函数旁瓣越来越小,但是不为0 ; 怎么降低这个特性? 怎么得到锐利截止滤波器? 其实这是矛盾的,
怎么构建空间滤波器核? 1 取平均, 导数 2 高斯函数, 取样 3 一维 空间滤波器绕中心旋转
平滑空间滤波器,
怎么空域滤波? 模板, 二维线性滤波,
噪声是独立的,
算术平均的缺点是什么?
盒式 滤波
所有系数都相等 课后题目 3.26 , 3.34 把mask中的平均值赋给中间像素 缺点: 会模糊。
低通高斯滤波器核
高斯核和 box 平滑特性对比
box 有线性 平滑 高斯核是可分离的圆对称核, edge 过渡更平滑
edge 填充方法有哪些? 1. 基本方法zero padding, 会有一圈黑框, 都是0 . 2. 镜像padding 3. 复制padding 复制填充,就是和周围一样.
滤波core 和图像大小相关。 应用: 保留大尺度物体, 矫正阴影.
order statistic filter统计排序非线性滤波
光照不均匀 = 》 阴影 怎么校正? 1 是低通滤波
什么是中值滤波?
固定长度的窗口,取窗口中的中位数 ,作为中间的值. 突发脉冲(比如椒盐噪声), 小于窗口尺寸一半就会被抑制.
二维中值滤波 可以选方形或者十字型, lab2 要做 linear smoothing 滤波缺点是在 binary edge ,比如一边全黑一边全白, 会有中间态导致模糊,
缺点: 对比度降低。
锐化, 高通空间滤波
突出灰度的过渡部分, how 边缘锐化? 图像微分.
一阶微分, 二阶微分。 可以用来边缘定位, 零交叉就是斜坡的中点,
最简单的拉普拉斯算子
二阶微分。有什么特点? 所有系数加起来和为0 ; 一阶导有什么特点?一阶导响应是什么样的? 怎么定位? 图像边缘起点, 二阶导有过零点。
叠加原图有啥用? 啥时候要相加? 啥时候要相减? 模板中心为正,
思考:拉普拉斯 算子可分离吗? 不可以,因为 秩 != 1 均匀背景, 响应弱。 边缘, 响应强。
怎么图像增强? 将原图和拉普拉斯图像叠加在一起,可以复原背景特性并保持锐 化效果。 g(x, y) = f(x, y) c*[拉普拉斯算子 f(x, y)] • 注意模板中心像素符号的正负,进行两者相加或相减 • 若 模板中心为正:取c=1, 得到合成的增强模板
显然这是线性的。可以得到合成模板。
非锐化掩蔽和高提升滤波 f(x, y)
• 先求出图像的低频分量( ) • 再从原图像 中减去低频分量,即 为图像的高频分量。 • 在原图上加上模板的一个权重部分:
平滑代表低通滤波, 突变的是高频分量,可以去除。 然后相减,可以得到去除的高频分量。
高频提升例子 • 从上往下: • 原图;高斯平滑图;非锐化模板 • 非锐化掩蔽,k=1; 高频提升,k>1(k=4.5)
微分方法
利用微分求出信号的变化率,相当于提取高频分量 把高频分量加回到原图上去,则有加强高频分量的 作用,从而使图像轮廓清晰。 边沿各种方向都有怎么办? 应采用各向同性的,旋转不变的线性微分算子才能 适用于不同的边沿 考点: 一阶导数锐化图像和二阶导数的区别 使用一阶导数锐化图像——梯度 对图像函数f(x,y),点(x,y)处的梯度: 就是这一点变化率最大的方向 对数字图像,用差分来近似微分 Roberts梯度算子 斜对角做 差分 梯度大, 一般是图像边缘和纹理。 梯度算子 • Sobel 算子 相当于一阶微分。 • Robert交叉算子 与拉普拉斯算子一样,梯度 核的所有系数之和为零。
利用梯度算子的图像锐化变换 (1) g (x , y) =GM(x ,y ) 梯度幅值
低通、高通、帯阻和带通滤波器
• 高通、帯阻和带通滤波器都可以 由低通滤波器构建;• 得到一维滤波器函数后,可以据 此生成二维可分离滤波器函数, 或者旋转这些一维函数得到二维 核。 • 高通在频域中为“1‐低通传递函数 ” ,空域中为“单位冲激‐低通卷积 核” 傅立叶反变换得到 空域一维 旋转 得到二维。 但这种情况在左图中就出现的比较少. 例子 • 同心圆反射板,用于测试滤波方法的正确性。 一维低通空间滤波器传递函数 绕中心旋转得到的二维低通核 用可分离核滤波效果,呈“方形”对称 用各向同性核滤波效果 ,呈圆型对称
空间增强的混合方法 • 经验1:梯度变换在边缘的平均响应比 拉普拉斯操作的平均响应更强烈; • 经验2:梯度变换对噪声和小细节的响 应要比拉普拉斯操作弱,且可以通过均 值滤波进行平滑处理进一步降低噪声; • 混合方法 • 对梯度图像进行平滑并用拉普拉斯 图像与它相乘。 • 目的:保留灰度变化强烈区域的细节, 降低灰度变化相对平坦区域的噪声。
第四章 频率域滤波
频率域和空间域的区别? fft 比空域 计算更快.
可分离模板优势?
高频强调滤波, 高通滤波器偏离了傅立叶变换的原点, 加上偏移量 , 乘一个大于1的常数,
傅立叶变换的可以完全通过 傅立叶inverse 来重建, without any lose。
空域米, 频域是 每米多少个周期。 时间域 秒, 频域是每秒多少个周期就是hz
简单窗函数的FT
F(u)的零点 和盒函数 宽度W成反比. 旁瓣高度随距离远点增大而减少.
ft是线性, 不是移不变的。
怎么样的函数是带限的??频率在一定范围的? ft 一定是从 负无穷到正无穷 但是没有负无穷。 所以没有完全带限的频带。 都是低通滤波后。
怎么 从离散-》 连续? sinc函数重建卷积和。
只能处理有限样本怎么办? 一个周期内 采样,然后 离散傅立叶变换. 构造一个变换对
dft 的频率resolution depends on the continous time of space domain. the width of frequency depends on the sampling interval. just like we see people, the longer we look at people, we learn more about peole.
空域持续时间长,-》 频率高分辨率。 采样多-》 空域高分辨率。 接近上面的 无限时间,连续采样。
二维 expand
矩形box 2dimension ft 两个sinc函数乘积
二维取样定理
图像中的混淆
重取样后混淆 降采样,放大, 锯齿现象, 欠取样。有些地方有混叠, 图像放大也有锯齿,
摩尔模式, 周期取样, 一个取样模式 乘 一个场景模式, 《=》 两个模式相乘。
二维DFT的性质
空间持续时间和频率域样本的间隔成反比
平移性
频域移动,. 空间域移动,相当于频域相位改变但是幅度不变. 作业4.47有
周期性, 频谱平移, 高频移动到中间,看的更清楚 怎么让 频谱图移动到中心? 相当于移动了半个周期, 空域中相位移动,乘 -1的x+y次方
对称性, 序列中点的对称。
3月30日 第四章ppt 44页 傅立叶变换 对称性 0 -1 0 1 是奇函数, 关于f(2)奇对称, f(2,1,1,1)是偶函数 0 -1 0 1 0 不是奇函数也不是偶函数 中点是在2。5 的位置,不是奇函数
共轭对称, 实部相等 第0列是 n/2 点对称,第0行也是 其他点关于 (n/2, n/2 ) 点对称。 所以对于实函数 ,dft都是有 特点的。 我们通常关注幅值。
为什么均衡化后就增强了?
频谱混叠后,有什么后果? 图像首先变模糊,可能纹路不一样, 加低通滤波可以ppt32 第四章
傅立叶谱和相位角
功率谱: 实部平方+ 虚部平方
幅度谱 对平移不敏感, 对旋转敏感
相角的变化:
相位谱 对图像内容更重要, 相位 乘 -1 , 就会x y轴都reflect , 因为频域变成了共轭,
二维卷积定理 -》 要避免缠绕。
和傅立叶变换什么关系?
频域中
周期扩充 必须函数补足周期
零填充方法, 为了避免缠绕错误, 振铃效应也更轻. 引入了不连续的黑边 怎么零填充?
作业题4.42 零填充可以让垂直和水平轴的信号强度显著增强.为什么? 因为有黑的边框, 是频域中的高频分量.
频率域滤波步骤小结
•1.将大小为MN的图像 ,根据填零规则扩展为PQ, 典型地,P=2M,Q=2N,得到填零后的图像 •2. 用 将图像平移; •3. 计算来自上一步函数的DFT,得到F(u,v); •4. 生成一个实对称的,大小也为PQ的,中心在(P/2,Q/2) 处的滤波函数H(u,v),并与F(u,v)相乘; •5. 得到处理后的图像 •6. 提取 的左上限MN区域,即为滤波后
作业 4.43 , 为啥 里面的文字dip 会颠倒了? 你把每一步的频域和时域写出来 最后算出f(-x,-y)
如果不是0 , 补充0 会有频谱泄露, -》图像 产生块效应。 补救方法: 高斯窗函数 降低泄露
傅立叶变换可分性
二维DFT可通过两个依次按照行和列的一维DFT变 换来得到,这是一个重要的简化。 • 先计算每一行的一维DFT,再沿着计算结果的每一 列进行一维DFT 2个一维 代替 二维 -》 减少计算量 正变换 获得反变换
同态图像滤波
• 图像的照射分量通常由慢的空间变化来表征,而反射分量 往往引起突变,特别是在不同物体的连接部分。 • 这些特性导致图像取对数后的傅里叶变换的低频成分与照 射相联系,而高频成分与反射相联系(近似地),因而可 以采用不同方法衰减(增强)照射(反射)的贡献。 同态滤波的特点: (1)由于需要进行对数和指数运算,计算量大。 (2)对于加性噪声,不能用同态滤波滤除。
二维傅立叶变换
有哪些性质? ? 1 线性变换 2。 不是移不变变换 3。
Gaussian lowpass filter (GLPF) transfer
lab3
高通滤波和阈值法可以增强图像, 减少慢变污染,增强脊线.
钝化模板(锐化或高通图像):从一幅图像减去 其自身模糊图像而生成的锐化图像构成。在频率 域,即从图像本身减去低通滤波(模糊)后的图 像而得到高通滤波(锐化)的图像。
高频滤波后的图像,其背景平均强度减小到接近黑色(因为高通滤波器滤除傅里叶变换的零频率成分: F(0,0)=f(x,y)=0)
解决办法:把原始图像加到过滤后的结果,如拉普拉斯算子增强,这种处理称为高频提升过滤. 低通和高通有对偶关系 频域滤波 G(u,v) = H(u,v) F(u,v) H h p ( u , v ) = 1 − H l p ( u , v ) Hhp(u,v) = 1-Hlp(u,v) Hhp(u,v)=1−Hlp(u,v) lp就是lowpass , highpass
陷波是怎么实现的? 要保持相位不变, 关于原点对称那一点也要陷波。
空间和频率域滤波之间的对应 • 空间域滤波器和频率域滤波器是一对傅里叶变换对; • 由于空间域滤波器(空域)也对应于频率域滤波器对单位冲激 的响应(频域),因此 也称为H(u,v)的冲激响应; • 实际当中 的数值个数有限,因此称为有限冲激响应(FIR) 滤波器,是线性的。 • 在DFT中,滤波实际上是相同尺寸函数的循环卷积;而在空域 中,滤波是不同尺寸函数的普通卷积。 •DFT是线性变换,因此只能实现线性滤波;而空域中可以实现 非线性滤波。
fft
算法原理是什么? 每个 f(u) 有n次复数乘法, n-1次加法。 怎么加速? ppt 114页, 数学归纳法推算出来
计算量的减少: • 如N=1024 ,乘法次数的减少量: 即只有原来的约1/200 • 加法次数只有原来的约1/100
蝶形算法
三.FFT算法的实现 • 先对输入进行排序:可用二进制序号高低反转进行定序 • 如,6=(110),倒序后为(011)=3,故排在第3位
图像重建
噪声模型 • 数字图像的噪声(点)主要来源于图像的获取和传输过程 图像传感器常是噪声的最主要的来源 • 一般噪声的频谱很宽,可认为是白噪声。 但有时干扰会呈一定的周期性,这时对应的频带较窄。 • 噪声的幅度,通常可近似认为: 1.与空间坐标不相关 2.与图像内容无关 3. 幅度分布是随机的,并可用某种概率分布来近似
噪声有哪些? 高斯噪声 直方图左右对称中间高,瑞利噪声中间高左右不对称, 均匀噪声直方图类似长方形 , 脉冲噪声,
泊松噪声 泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。 由于光具有量子特效,到达光电检测器表面的量子数目存在统计 涨落,因此,图像监测具有颗粒性,这种颗粒性造成了图像对比 度的变小以及对图像细节信息的遮盖,我们对这种因为光量子而 造成的测量不确定性成为图像的泊松噪声。 • 实际中,根据先验或者统计分布,来判定噪声类型, 然后根据均值和方差来解出模型参数。
常见噪声的形成原因
• 噪声模型为实践中建立宽带噪声勿扰状态的模型提供了有用的工具。 • 在胶片上成像时会有胶片的颗粒噪声 一般,颗粒噪声可认为是高斯白噪声,其标准差与局部灰度立方根成正比。 • 光电子噪声是由光的统计过程和图像传感器中光电转换过程引起的 弱光照的情况下,其影响较严重,这时可认为这种噪声具有泊松分布,其标准差接 近于图像均值的平方根在光照较强时,噪声分布更接近于高斯分布。 • 处理信号的放大电路会引入热噪声——电子噪声 一般可看作为零均值高斯白噪声。因此只要知道标准差就可完全表征
周期噪声
• 周期噪声是在图像获取期间由 电力或机电干扰产生的,是一 种空间相关噪声。 • 空间正弦噪声对应于傅里叶谱 中的共轭脉冲。
噪声的估计
周期干扰 典型的周期干扰的参数可通过对频谱图的分析来估计 有时也可直接在受污染的图像上推断干扰的周期特性 • 传感器噪声有时噪声的概率密度参数可根据传感器确定,但与使用环境有关,光照不同,变 化很大通过测试获得噪声的参数 一般的图像 • 找一些有理由认为平坦的区域,统计其直方图,从而从直方图形状确定分 布的形式,再估计分布的参数 • 对于视频图像可利用帧差法减小图像内容对噪声估计的干扰,静止区图像 内容将被减去。但视频图像间总会有微小运动,如果只在平坦且静止的区 域检测噪声,则更合理 这里都是考点 1。 算术均值滤波 = box滤波 2。几何均值, 相乘开方, 性能和算术相似, 较少丢失图像细节, 较好保留暗像素。 3。 谐波均值滤波器: • 善于处理盐粒噪声和高斯噪声,但不适用于胡椒噪声;
4。逆谐波均值滤波器: • Q称为滤波器阶数 • 当Q>0时,适用于消除“胡椒”噪声 • 当Q<0时,适用于消除“盐”噪声 • Q=0时,成为非加权平均滤波器(算术均值滤波器) • Q= -1时,成为谐波均值滤波器
利用中值滤波器重复地对 图像处理会有什么后果? 使图像变得模糊,因此应尽可 能降低处理次数。
自适应滤波器 • 所谓自适应滤波器,其特性是以滤波器覆盖的局部区域 内图像的统计特性为基础的; • 自适应局部降噪滤波器
空域 非线性滤波 比频域更方便。
考点 : 空域和频域的区别?
自适应中值滤波器 标准中值滤波一律以中值代替原值,会引起不必要的细节损失; • 随着脉冲密度的增大,需要更大的窗口来消除尖峰噪声 • 与普通中值滤波器的不同在于能根据某些条件而改变滤波窗口大 小(目的是找到合适的中值); • 分为两个进程: • A:若中值介于滤波窗口中两个不同的最大与最小值之间,则转入进程B (确保中值不是噪声);否则增大窗口尺寸,继续循环;若尺寸已经最 大,则输出当前中值; • B:若当前像素灰度值介于滤波窗口中两个不同的最大与最小值之间, 则输出当前当前像素灰度值,否则输出窗口中值。(减少不必要的细节损失) • 基于如下目的:去除椒盐噪声,平滑其他非脉冲噪声,并减少滤 波中的失真。 • 随着脉冲密度的增大,需要更大的窗口来消除尖峰噪声。
最佳陷波滤波
• 两个主要步骤: • 1.通过陷波带通滤波器获取噪声模式的空域近似值; 2.原图像减去噪声的加权量,使得恢复图像在每个像素邻域内的方差最小
估计退化函数
• 许多类型的退化可以近似为线性、位置不变的过程。 • 图像去卷积通常用于表示线性图像复原,用于复原处理的滤波器常被称为 去卷积滤波器()。• 使用以某种方式估计的退化函数来复原一幅图像的过程,有时称为盲目去 卷积; • 主要有3种估计退化函数的方法: • 1. 观察法 • 2. 试验法 • 3. 建模法
图像观察估计退化函数
• 考虑图像被线性、位置不变的过程退化的情形,只要得到变换前后的傅里 叶谱,就可以得到退化函数的傅里叶变换H。 • 以高信噪比区域g为子图像处理,通过各种增强方法获得(假设)没有噪 声时的图像f,则获得该子图像的H为: • 基于 在更大比例上构建具有基本相同形状的函数 或者 看 相对平坦的区域 如墙面观察 噪声。
试验估计退化函数
• 如果可以使用与获取退化图像的设备相似的装置,得到一个准确的 退化估计理论上说是可能的。 • 利用一个理想冲激及其得到的实际退化图像(冲激响应),获得退 化函数为
解决病态问题的一种方法 是将限制滤波的频率,将 频率限制在原点附近,降 低遇到零值的概率
半径越大越接近于直接逆 滤
数字图像处理2
第五章ppt 53页 逆滤波及其病态性质 • 图像模糊的频域表示 结果为原图F加一噪声项,在H(u,v)接近于零时,噪声项会很大,使图像 淹没在噪声中——病态性质 • 图像恢复一般都会遇到病态性 • 图像恢复要重点考虑如何控制噪声的干扰,即控制病态性 逆滤波示例 考点:
• 解决病态问题的一种方法是限制滤波的频率,将频率限制在原点附近,降低遇到零值的概率。 • 半径越大越接近于直接逆滤波
wiener滤波
对实际图像,不同区域的信号功率谱是不同的:即有的地方亮,有的地方暗,有的地方相关大,有的地方相关小,若用全局的: • 局部信号功率谱较总体平均大(较亮处) :用总体的信号功率谱会偏小, 噪信比偏大,会使滤波增益降低,使空间频率丰富的结构不能很好 恢复 局部信号功率谱较总体平均小(较暗处):滤波增益太大,可能会放大噪声 • 实际上,只要比值不超过2:1,滤波器的响应不会造成可察觉的变化 ### 约束最小平方恢复 • 维纳滤波要求未退化图像和噪声的功率谱都是已知的;未知时用 功率谱比的常数估计,未必总能得到合适解;• 约束最小平方恢复只需要噪声方差和均值的知识,容易估计获得。 • 维纳滤波建立在最小化统计准则的基础上,在平均意义上最优, 但未必每幅图像最优;而约束最小平方恢复对于每幅图像都能得 到最优结果。
计算方法:将离散拉普拉斯算子作用于图像上每一点,所得结果 作平方和
对于噪声,一般可得到其一些统计特性。如方差、均值 • 假定噪声的能量为一已知常数, gamma 可以自动处理, 迭代获得, p(u,v)是高通滤波器,低频接近0 。效果类似维娜滤波器中噪声信号功率谱之比。 已知噪声均值和方差, 可以估计gamma,
残差 = 》 能量, 能量是gmma 单调递增函数, 残差太大说明gamma太大,所以就反复迭代,让误差在一定范围内。
几何均值滤波器(频域)
几何均值滤波包含维娜滤波 Hg(u,v) 若α=1,则成为去卷积滤波器,即逆滤波器; • 若α=1/2,实际上是逆滤波器和参数化维纳滤波器的几何平均, 故称为几何均值滤波器; • 若α=1/2,且γ=1,得到的滤波器称为功率谱均衡滤波器; • 若α=0,则就是参数化维纳滤波器; • 若这时γ=0,就成为逆滤波器; γ=1,标准维纳滤波器,一般可通过 选择γ的数值来获得希望的维纳平滑效果。
投影重建
Radon transform 雷登变换 , 给一条直线, 对这条直线上的像素灰度求和. 白色是255, 黑色是0
作业5.42 A Sketch a cross section of the Radon transform of the following white disk image containing a smaller black disk in its center. (Hint: Take a look at Fig. 5.38.) 用这种方法重构的图像会产生很严重的模糊。 层图仅仅是对 产生投影的图像的一个近似。
傅立叶切片定理
一个图像某方向投影的傅里叶变换就是该图像的二维傅里叶变换在该 方向的一个切片重建 v • 直接傅里叶反变换重建 • 在不同的θ角得到许多投影 • 得到频域的许多切片 • 得到信号的频域表示F(u,v) • 恢复实际信号f(x,y) 应用时: • 对获得的投影Pθ(t),进行离散Fourier变换,即得到F(ω,θ) • 再通过内插产生F(u,v) • 利用DFT得到二维图像阵列 • 重建结果同样存在模糊
最重要的是 加窗, 做一个滤波 (1)计算每个角度投影的一维傅里叶变换; • (2)用滤波函数乘以每一个傅里叶变换,并乘以一个合适的窗; • (3)求每一个滤波后变换的一维反傅里叶变换; • (4)对上一步骤得到的所有一维反变换,进行角度方向的积分(求和)
图像噪声很微弱, 逆滤波是可以的。 噪声比较大, 逆滤波是不行的, 在边缘传递函数 h 很小,可能噪声就被放大的很大。也就是病态性质。 可以用维纳滤波来解决.
chapter6 彩色
CIE规定 红光, 绿光, 蓝光, 为了标准化, 不意味着可以产生所有谱.不能产生所有颜色. cmy 青色, 品红, 黄, cmyk 彩色模型。 RGB和CMYK对于硬件实现很理想,也与人眼强烈感受三原色的事实很好匹配,但不能很好地符合人实际上解释的颜色; • 人通常用色调、饱和度和亮度来描述颜色。
亮度:无色的强度概念; • 色调:光波混合中与主波长有关的属性,表示观察者感知的主要颜色; • 饱和度:相对的纯净度,与一种颜色混合白光的数量有关; • 色调和饱和度合起来称为色度 HSI看 作业题6.14 ,
伪彩色变换
一幅黑白图像,灰度范围是0 -Mf,分成N个不同的灰度区间Li, i=1,2,…,N. 给每个灰度区间分配一种色彩,比如将50~75灰度区间显示 成黄色,…,则成了彩色图像 另一种伪彩色变换函数: 三个频率相同、相位不同的正弦函数。如正弦 函数的半个周期. 这里也有一个lab.
多光谱图像的彩色编码 目的: 使增强后图像中各目标呈现与原图不同的彩色,使 感兴趣的目标有醒目的彩色;使正常景物呈现出与 人眼色觉相匹配的颜色 遥感本身不产生颜色。
标量和向量处理
• 单个彩色分量处理的结果并不总等同于彩色向量空间的直接处理,除非满足如下两个条件: 处理必须对向量和标量都可用; 对向量的每一分量的操作对于其他分量独立。 • 很多操作,比如中值滤波,就无法相同
HSI空间的直方图处理增强
单独对彩色图像的RGB分量进行直方图均衡,将产生不正确的颜色, 因此不能采用。 可以在HSI空间开展。
•习题 6.3,6.5, 6.14, 6.16, 6.24, 6.28 •上机作业(2选1) 1. 用图6.23所示的方法实现一种伪彩色变换; 2. 对类似图6.46的带噪声彩色图像进行平滑滤波处理。
彩色图像的平滑
彩色平均平滑可以在每个彩色平面的基础上执行,结果与使用彩色向量执行平均是相同的。 RGB空间的平滑与HSI空间的平滑有差异,而 且随着滤波尺寸的增加而会变得 更加显著 为什么? RGB空间平滑后得到平均颜色,而HSI中颜色不变
彩色边缘检测
• 直接计算单分量图的梯度幅值,然后用得到的结果相加,合成一幅彩色图像可能导致错误的结果 RGB向量空间中的梯度与分量梯度相加的效果比较:向量梯度边缘图的细节更完整。
彩色图像中的噪声
带噪图像的HSI分量。 注意噪声对H和S图像的 影响最大,而噪声在I图像中却显得轻微些。 为什么? 求余弦和最小值操作的非线性造成。I中本身是三分量的平均,噪声影响小。
第十章 图像模式分类
模式匹配 基于匹配的识别技术通过一个原型模式向量来表示每个类。根据一 种预先定义的度量,将一个未知模式赋予最接近的类。最简单的方式是最小距离分类器。 x表示n维度模式向量, mj 是该类模式的平均向量,也就是模式的原型定位.
相关匹配目标检测的问题: 1. 计算量大; 2. 不具有旋转和尺度不变性; 3. 对形变、遮挡和光照变化等敏感。
最佳统计分类器
如果考虑模式类的统计特性,则可获统计平均意义上最佳的分类器
考点 8、Bayes意义下,最小距离分类器最佳条件 分类器有W个类,针对每个样本,计算判别为每个类的平均损失,并将样本对应的最低损失赋给相应的类,则关于决策的总体平均损失将是最低的 。这种将总体平均损失降至最低的分类器称为贝叶斯分类器
一般情况下,正确决策的损失通常赋值0,而不正确决策的损失通 常被赋予相同的非零值比如1 。 决策函数最大的类为样本所属的类别。 必须知道每个类中模式的概率密度函数及每个类出现的概率; 概率密度函数的估计相对困难。一般假设一个解析表达式,而且 来自每个类的样本模式有一个必须的参数估计,比如高斯分布
当均值间的距离与每个类的分散度或者随机性相比较大时,最 小距离分类器工作得很好
可以证明,Bayes分类器具有最小错误概率 决策边界怎么算? 就先算均值, 方差, 然后求判决函数, 再求分类决策边界.
exam : 7、两个一维高斯类,最佳决策平面
8、Bayes意义下,最小距离分类器最佳条件 答案: 1 所有模式都是高斯的, 2 所有协方差矩阵都是单位矩阵, 3 所有类出现的概率相等。
如果先验概率相同, 那么决策边界是哪里?概率不同, 会怎么移动?
ANN 人工神经网络 人脑功耗低,吃点饭就行了。 最小均方误差 LMSE 找到误差的参数配置
xor解决不了,因为 单个感知机只有线性 多层前馈神经网络, 感知机用hard threshold , 0附近波动很大,有严重的稳定性问题, 解决方法是 用 sigmoid 平滑函数
反向传播
1。 输入模式向量 2 前向 pass 3 反向传播 4 更新weight 和bias偏置 重复1-4 ,直到误差达到可以接受的水平.
反向传播矩阵公式
训练的时候参数很多, 或者深度太大可能过拟合, 在test set 表现很差。
cnn的特点:
1 直接从原始图像学习二维特征。 2 各层 卷积连接,而不是全连接 3层间降采样(池化pooling) 降低输入中对平移变化的敏感度 全卷积网络(FCN) LeNet DCNN ppt上没仔细讲,书上有仔细讲.
作业题有个cnn.
池化: 三种常见的池化方法是:(1)平均池化,其中每个邻域中的值都被该邻域中的平均值代替; (2)max-pooling,用其元素的最大值替换邻域中的值; (3)L2池化,其中所得池化值是邻域值平方之和的平方根。 每个功能图都有一个汇总的功能图。 合并的要素图统称为合并层。 在图12.40中,我们使用2x2倍池化,因此每个结果池化图的大小是前一个特征图的四分之一。 接受域的使用,卷积,参数共享和池化是CNN特有的特征。
在第一层中,我们有一个输入图像和三个特征图,因此我们需要三个内核来完成所有必需的卷积。 在第二层中,我们有三个输入和七个特征图,因此所需的内核(和偏差)总数为37 21×=。 合并每个要素图以生成相应的合并要素图,从而生成七个合并要素图。 在图12.40中,只有两层,因此这七个合并的特征图是最后一层的输出。 图12.41的最上一行显示了特征图和合并特征图的相对大小作为接收场和合并邻域大小的函数的数值示例。 输入图像的大小为28 28×像素,接收场的大小为55×。 如果我们要求在卷积期间将接收场包含在图像中,则从第3.4节中知道,所得的卷积数组(特征图)的大小将为24 24×。 如图所示,如果我们使用大小为22×的池化邻域,则生成的合并特征图的大小将为12 12×。
第七章形态学
这些非常需要结合图像来理解. 腐蚀: 被扫描到的原始图像中的像素点,只有当卷积核对应的元素值均为1时,其值才为1,否则其值修改为0。
膨胀:用B膨胀A得到的集合,是B的映像 位移与A至少有一个非 零元素相交时B的原点位置的集合 膨胀会“增长”或者“粗化” 二值图像中的物体。这 种特殊的方式和粗化的 宽度由所用的结构元来 控制。 膨胀和腐蚀的对偶性 • 对目标进行膨胀,相当于对背景进行腐蚀 • 对目标进行腐蚀,相当于对背景进行膨胀
开操作:先腐蚀后膨胀。外凸角变圆了,内凹角不受影响 连续开操作, 第二次和第一次有什么变化? 答案: 外凸角变圆了,内凹角不受影响。 多次开操作之后会稳定一个图像。
顶帽(top hat)是原图像与开操作之间的差值图像 考过开闭操作
开操作能把比结构元小的斑点、突刺滤掉,能切断细长搭接而起到分离作用.可以去掉小的白噪点,填充小的白洞。能排除小区域物体、消除孤立点、去噪、平滑物体的轮廓。 • 闭操作先膨胀后腐蚀,能把比结构元小的缺口或孔填上,搭接短的间隙而起到连通作用。可以填充小的黑洞(fill hole补洞),去掉小的黑噪点。填充目标区域内的离散小空洞和分散部分。
lab 4:边界提取, A-(AΘB) = 边界
结构元匹配。 基本操作:测地腐蚀、测地膨胀操作。与基本的腐蚀膨胀不同的就是在腐蚀膨胀过程中引入了标记图像F,将原图作为模板图像G作为限制。 测地膨胀模板用来约束,结果不能大于模板。
形态学重建开操作:先腐蚀很多次,再测地膨胀。 有什么不同? 优势在哪里? 重建开恢复原始模样更完整。 形态学重建闭操作:先膨胀很多次,再测地腐蚀。
填充孔洞(不如说是寻找内部孔洞区域,对外部噪声抑制效果较好):对二值图像取反;对标记图像进行测地膨胀操作后取反;对两者求交集。 目的是在抑制外部噪声的情况下,找到内部孔洞区域。
边界消除(也可以说是找到目标边界,同样对外部噪声抑制效果较好):对二值图像取反;对标记图像进行测地腐蚀操作后取反;对两者求交集。 目的是在抑制外部噪声的情况下,找到目标边界区域。 孔洞填充 - 条件膨胀, 根据需要膨胀。
连通分量的提取。 原理与区域填充方法相似, 都是采用条件膨胀,只是把 条件改为膨胀限制在区域A 内部,即与区域A相交。
凸壳 该方法先反复使用作击中或击不中变换,当结果不在变化时,执 行与A的并集运算,结果为 ;重复使用这一过程;最后得到的4个D 的并集组成了A的凸壳。
细化 • 逐渐去掉集合上的边界元素 • 细化过程可以根据击中变换定义
骨架化(中轴变换) • 骨架可看成是区域边界内切圆的圆心的集合
形态学重建
形态学重建涉及两幅图像和一个结构元,一幅图像是标记,包含操作的起始点,另一幅图像是模板,约束该变换。 集合求交在每一步中都执行,并约束标记F的膨胀,保持其小于等于模板图像G 测地腐蚀 来自标记图像F对模板图像G的膨胀形态学重建,被定义为F关于G的测地膨胀,反复迭代直达到稳定状态。
形态学重建的应用 • 重建开操作 • 形态学开操作中,腐蚀会删除小的物体,而后的膨胀试图恢复遗留物体的形状,但恢复的准确性高度依赖于物体形状和所用结构元的相似性。 • 重建开操作可以正确恢复腐蚀后所保留物体的形状。
填充孔洞 • 普通孔洞填充时,需要对每个孔洞确定一个已知起始点。基于形态学重建,可以建立一个全自动化的孔洞填充过程。
形态学重建的应用(3) • 边界清除 删除接触边界的物体,可以屏蔽图像,处理只保留完整的物体;可用 作视野中存在物体的一个信号。 找到那些只有一半的字符,去掉他们。
• 灰度膨胀操作通常有二种效果: • (1)如果结构元函数值都为正,则结果趋于图像更亮 • (2)根据所用结构元的值和形状,发暗的细节被减小或消失。
灰度开操作常用于去除较结构元小的发亮细节,同时相对地保持整体图像灰度和较平坦的明亮区域不变。 • 灰度闭操作常用于除去图像上的暗细节,而亮细节或平坦的暗区域基本不受影响
形态学平滑 • 因为开操作抑制比结构元小的亮细节,而闭操作抑制暗细节,因此将他们组合起来实现形态学滤波, 用于图像平滑和噪声消除; • 先对图像进行开操作,再对结果作闭操作 结构元越大,边界去的越干净,里面填充也效果越好。
形态学梯度 膨胀粗化一副图像中的区域,而腐蚀则细化他们。膨胀和腐蚀的差强调了区域的边界,产生类似与微分的效果。 • 能加强图像中灰度变化强烈的区域 • 如果采用对称结构元,则对边缘方向不敏感。
背景灰度不均匀,颗粒状前景分割,顶帽变换可以校正阴影。
第八章图像分割
考点 一阶导数和二阶导数的区别 1. 一阶导数通常产生较粗的边缘; 2. 二阶导数对精细细节,如细线、孤立点和噪声有较强的响应; 3. 二阶导数在灰度斜坡和灰度台阶过渡处会产生双边缘响应; 4. 二阶导数的符号可用于确定边缘的过渡是从亮到暗还是从暗到亮
基于不连续性,梯度分割 基于相似性, 方差分割
并行算法 串行算法 并行边界 pb parallel boundary 点检测 线检测 可以用拉普拉斯模板,但二阶导数的双线必须做适当处理(用绝对值会使线宽加倍,可以仅保留拉普拉斯的正值 边缘模型:一阶导数的幅度可用于检测图像中是否存在边缘;二阶导数的符 号可确定一个边缘像素位于暗的一侧还是亮的一侧; 二阶导数的零交叉点可用于定位粗边缘的中心。二阶导数对噪声更加敏 感; 使用导数之前的平滑处 理是必须考虑的问题 ### 梯度算子 Prewitt算子实现较简单,但Sobel算子对噪声的抑制能力更好些,一般 Sobel算子有较好的效果; sobel 改了改权重,根据距离远近进行了加权, 罗伯特交叉(Roberts)算子 考点: Prewitt、Roberts等算子区别 prewitt实现简单, 但是噪声抑制不如sobel。
拉普拉斯算子的缺点是: (1)边缘元的方向信息被丢失; (2)采用二阶差分,双倍加强了图像中的噪声。 拉普拉斯算子的优点是: 各向同性,即旋转不变。
Marr-Hildreth边缘检测器(LOG) 需要考虑图像噪声和边缘本身特性; 理想的边缘检测器应该满足的特点: 1. 应该是一个能计算图像中每一点处一阶或者二阶 导数的数字近似的微分算子; 2. 应该能被调整以便在任何期望的尺寸上起作用。 比如:大的算子用于检测模糊边缘,小的算子用于 检测精细细节。
Marr和Hildreth论证了满足这些条件的最令人 满意的算子是LOG (lapalace of gaussian)
用坎尼算子检测边缘时,若像素满足以下三个条件, 则认为是图像边缘点:
(1)该点的边缘强度大于沿该点梯度方向的两个相邻像素点的边缘强度; (2)与该点梯度方向上(近似)相邻两点的方向差小于 45°; (3)以该点为中心的3×3邻域中的边缘强度极大值大于 某个阈值。 考点:3 Canny检测步骤 四步 (1)用一个高斯滤波器平滑输入图像; (2)计算梯度幅值图像和角度图像; (3)对梯度幅值图像应用(局部)非极大值抑制(两边都是极大值才选择); (4)双阈值处理和连接分析来检测并连接边缘。 双阈值中,高低阈值比例建议为2:1或者3:1。
后面可进一步采用形态学细化操作,细化边缘为1个像素
考点4、
基于阈值处理的分割中影响波谷特性的因素
直方图模式的谷的宽度和深度直接关系到灰度阈值法分割的成功与否。 影响波谷特性的关键因素:五点 1波峰间的间隔; 2图像中的噪声内容; 如果噪声灰度扩散就不好分割 3物体和背景的相对尺寸 前景太小就不好分割 4 光源的均匀性; 5图像反射特性的均匀性。
霍夫(Hough)变换——已知形状的曲线检测
参数空间, 投票量化, Hough变换的缺点 参数空间的量化精度不易确定,需要结合实际 多次调整 由于没有图像的先验知识,这种调整是不容易的 不合理的量化可能产生如下问题: 不能检测特殊曲线 难于找到局部最大值 低精度 较大的存储空间 , 较低的计算速度 改进:随机Hough变换
阈值处理 : 处理直观, 实现简单速度快。图像分割应用处于核心地位。非常常用 利用同一区域内像素相似性进行图像分割的技术
三种: 全局阈值, 局部阈值, 动态阈值(阈值不仅与局部特性有关,而且与坐标位置也有关)。 聚类分割(Otsu方法) 假设图像中只有目标和背景,设置一个门限T 使分割后目标内部和背景内部总方差(称为类内方差 within cluster)较小 而目标与背景的灰度平均值之差又较大(用类间方差between cluster表示) 他的可分度量是什么? 什么意义下他是最优的? 取使类间方差最大(即最大)的T作为最佳阈值
利用边缘改进全局阈值处理
基于局部图像特性的可变阈值处理,自适应的, 邻域的标准差和均值。 利用边缘改进全局阈值处理 观察:如果直方图的两个波峰高、窄、对称,波谷深,则容易找到好的 全局阈值。 边缘对比度比较大
使用移动平均的可变阈值处理 对文档处理特别适合 对图像中的每个像素点计算移动平均 背景不均匀, 怎么用阈值? 不能用全局阈值。
多变量阈值处理(彩色图像) 局限: 没有考虑像素空间连续性,一些斑点可能变成前景。
8。4 基于区域的分割
8。4。1 区域生长 每个区域选择一个种子像素作为生长的起点,然后将种子像素周围与种子像素有相同或相似性质的像素,加入到种子像素所在的区域中(注意生长过程中要保持区域内的连通性。
区域分裂与聚合
slic超像素算法
这是补充内容, 老ppt没有。 和k-means 比,距离只针对2s-2s区域计算, 减少计算时间。 基于什么算法? 类似于k-means算法。 常数 c 加权 调整 颜色和空间 相对重要性 机器学习也常用, loss,多个loss函数也有相对重要性。
使用图割分割区域
是一个基于区域的方法。 更加复杂, 把 像素表示为图的各个节点。找到最小的图割。 最优准则:
特点: 效果较优秀, 计算复杂性较高。 对称矩阵表示图, 权重和节点对之间的相似度成正比。 如何关联图和图像? 边可以仅考虑4连通像素 边的权重 由空间关系,灰度测度形成 增加两个额外的节点: source,sink。 与之连接的边叫t链。 把每个像素归属前景背景概率表示出来, 概率大,t链权重大。 能通过的最大流量 就是瓶颈, 最大流 = 最小割 删除最小割会断开。 归一化割,这是np hard
形态学分水岭
经常应用在图像的梯度。 三种主要概念的分割:边缘检测(需要后处理连接)、阈值处理(速度快)、区域生长(连续性好),各有优缺点。 能产生更稳定的分割结果。包括连接的分割边界。为在分割中结合基于知识的约束提供了一个简单的框架。 主要应用之一是从背景中提取近乎一致的前景,经常应用于一副图像的梯度图,而不是图像本身。汇水盆地的区域最小值就 可以对应于感兴趣物体的较小梯度值。
构造水坝 , 最简单的是形态学膨胀也就是测地膨胀, 有约束的膨胀, 和原来的边界与操作。 导致两个图连通的地方建一个水坝(灰度加到最大值), 阻止他连通。
分水岭分割算法的局限性 通常会由于噪声和梯度的其他局部不规则性造成过度分割。 一个原因:存在着大量潜在的最小值。很多小盆地, 可以用平滑滤波器对图像进行过滤。 方法: 用标记约束感兴趣区域
~分割中运动的应用 累积差值图 adi accumulate different image
考点:
客观题: ADI特点 一幅累积差值图像(ADI)是通过将参考图像与序列中每幅后续图像 进行比较形成的。 当参考图像和序列中一幅图像之间在某个像素位置上出现一次差异 时,累积图像中每个像素位置的计数器计数一次。 有三类累积差值图,绝对ADI、正ADI和负ADI。R为参考图像。
简答2:考察ADI、主分量描绘 (1)求运动速度,注意除以的帧数为相差的帧数 (2)如何得到静止的彩色背景图 (3)一道简单的主分量描绘题,记住均方误差公式 ppt:ADI示例 当运动物体灰度大于背景时: 正ADI的非零区域等于运动物体的大小; 正ADI的位置对应于参考帧中运动物体的位置; 当运动物体完全移出参考帧物体时,正ADI的面积不再变化; 物体的运动方向和速度可以由绝对ADI和负ADI中的值决定。 负adi就是在外面移动的, 正adi就是在参考帧移动
今年还考了一个ADI如何得到没有运动物体的背景图 答案:把移出去时候的背景复制到最初被参考帧中物体占据的位置。
复习问题: adi有什么用? 可以得到静止的背景图. 可以得到速度,
分水岭分割用于什么形式的图像? 构建分离二元点集的水坝的方法主要是什么?用形态学膨胀 算法结果的边界有什么特点? 用于一个图像的梯度. 水从每个区域极小值上升, 当不同的汇水盆地聚集时, 修建一个水坝阻止这种聚合.
moore 边界追踪 方法 , 停止条件有什么要求? 为什么? 直到b = b0而且下一个边界点找到b1.
否则过早停止不能找到剩余边界. 有多个边界的时候, 一次处理一个边界.
第九章 特征提取
边界追踪
旋转归一化, 可以 差分链码。
考点:6、傅里叶描绘子怎么得到边界的特征? 坐标进行傅立叶变换 设边界上有N个点,按逆时针方向,坐标依次为(xk,yk), k=0,1,…,N-1,我们将其表示成复数形式 如果只利用傅立叶描述的前P个值,即舍去边界上的高频成分, 低频是轮廓,高频是细节。傅立叶选前18项就可以恢复, 所以可以大大压缩。 平移, 增加直流分量 旋转: 尺度:能量 c缩放 起点:频域相位移动
区域表示 区域表示是对分割后的目标区域的表达方法 •可不失真地表达整个区域的数据 •也可只表达从中抽取的一些代表性的数据 • 数组表示 • 目标区域内为1,在区域外为0,称为空间占有数组 •缺点是占用较大的存贮空间, 特别是区域面积较大时 • 四叉树表示 • 容易生成得到,特别是在用基于四叉树像素分块的分裂 合并算法进行图像分割时,在分割过程中就可得到四叉 树,只是不必作合并操作;
区域描述子 .区域面积 , 区域重心(区域形心 ) 圆度率(旋转、尺度不变)
拓扑描述符 是指那些变形不发生撕裂或连接变化的情况下,不因图像变 形而改变的性质 区域的二种拓扑性质: • 区域的连通数C • 区域的孔数H 欧拉数(Euler number) ——另一种拓扑性质 • E=C-H
纹理
三种主要的纹理描述方法:统计方法,结构方法和频谱方法。
统计方法
描述纹理最简单的方法之一是使用一幅图像或一个区域的灰 度直方图的统计矩。
共生矩阵:利用这些像素对得到的二维直方图 • 共生矩阵A的每个元素aij是具有灰度gi和gj的像素对在图像上出现的 数目.
结构方法
频谱方法
图像上周期性和方向性的纹理在频谱上有相应的表现 • 1.周期性纹理在频谱上有相应的能量集中区域 • 2.纹理的方向在频谱上表现为能量集中区域所在的方向
另外主成分分析也是喜欢考的,会考均方误差(等于没有算进去的特征值的和) 采用霍特林(Hotelling)变换,也常称为特征值变换、主分量变 换 • 随机矢量 • 随机抽取M个矢量 ,k=1,2,…,M,称为随机矢量的M个样本
均值矢量就是 样本sum/ 个数
第四版,补充内容,老ppt上没有: harris角点 特征值两个小 , 几乎恒定的灰度 一个小, 一个大。 存在垂直或者水平。 也就是边缘,不是角点 两个大, 存在一个角或者孤立的亮点
作业11.32: 上一节中讨论的 Harris-Stephens 角点检测器在以强度急剧变化为特征的应用中很有用,例如直边的交叉点,从而导致图像中的角状特征。 相反,由 Matas 等人引入的最大稳定极值区域 (MSER)。 更面向“blob”。 与 HS 角点检测器一样,MSER 旨在产生整个图像特征,以便在两个或多个图像之间建立对应关系。
复习: 考虑了灰度分布, 考虑相对位置的纹理分析是什么方法? 答:灰度共生矩阵 描绘子有哪些? .常用的纹理特征 : 最大概率, 对比度, 同质性,相关,熵。
熵大说明什么? 纹理比较随机。共生矩阵也随机。
傅立叶谱 用什么方法描述纹理? 极坐标, 一维方向统计。
不变矩 描述的特性? 平移,旋转, 尺度缩放, 但是光照变化,相机平移就不行。
向量的变换阵 a怎么得到? 原始向量的 协方差矩阵的特征向量按特征值由大到小排列。
15周 6月22日
harris角点应用 特征提取: 相机标定
klt跟踪 玻璃罩的 , 有畸变。
高斯差分, 是log的近似, log查找过零点, 改进关键点精度 , 候选点附近, dog 拟合内插函数 提升关键点位置精度。
sift算法
可以实现3d物体识别, 最少3个特征点。 优良的匹配正确性与旋转不变性。
关键点描述子不变性 方向不变性: 光照不变性:
1 构建尺度空间 sigma=1.6,s =2 , 三个倍频程 2 得到初始关键点, 在dog图像中查找极值。 3 泰勒展开, 内插 4 滤除, 删除低对比度和定位差的关键点 5 计算关键点方向 6计算关键点描述子
编辑于 2021-07-07 19:54
数字图像处理(书籍)
图像处理
数字图像处理基础(书籍)
赞同 1
添加评论
分享
喜欢
收藏
申请转载
文章被以下专栏收录
编程技术
编程技术
C语言应用,数据结构,C++,Java应用技术
推荐阅读
数字图像处理
第1、2章 绪论、图象处理的基本概念。 第3、4章 空域和频域变换 第5、8章 图象增强和图象复原。 第6章 图象编码 第7、9章 图象分割和形态学。 第1章 绪论 1.1 从图象到图像工程 图象和数字…
大师兄
数字图像处理
数字图像处理的内容: 图像数字化、图像编码、图像增强、图像复原、图像压缩、图像分割、图像描述、图像识别等 图像数字化。分为采样和量化。采样方法:点阵采样和正交系数采样。量化是指要…
努力生活的咸鱼
数字图像处理基础
数字图像处理基础
程序员阿德
数字图像处理
教材: RafaelC.Gonzalez, RichardE.Woods, StevenL.Eddins,等. 数字图像处理[M]. 电子工业出版社, 2014.第一章 绪论 1 数字图像处理的主要内容(基本步骤)是什么?主要内容:图像获取、图…
赵紫晴
还没有评论
写下你的评论…
发布
选择语言