图像处理的数学模型与高性能算法——介绍

一、图像复原

正问题(Forward Problem):从清晰图片到模糊图片

Ax+e=b,

模糊算子(矩阵)X 清晰图片 + 噪声 = 模糊图片

  • 矩阵A是模糊算子,表示模糊化这个物理过程,是已知的;
  • x是清晰(复原)图像,是未知的;
  • e是观测过程中的噪声,是未知的;
  • b是观测到的模糊图像,是已知的。

反问题(Inverse Problem):从模糊图片到清晰图片

任务:观测到的图像是模糊,带有噪声的,如何尽可能复原出清晰的图像?

数学模型:不适定反问题

Ax=b,b=b^{*}+e

矩阵A是模糊算子,x是未知清晰复原图像,b是观测到的模糊图像

不适定反问题(III-Posed Inverse Problem)

任务:观测到的图像是模糊,带有噪声的,如何尽可能复原出清晰的图像?

数学模型:不适定反问题

Ax=b \overset{\tau }{\rightarrow} x=A^{-1}b(=A^{*}b)

直接求解:高斯消去法,矩阵分解法,迭代法等。

不适定性:(Hardmard)

  • 解不一定存在\rightarrow \rightarrow最小二乘问题(数据拟合)
  • 解不一定唯一\rightarrow \rightarrow最小范数(能量)解
  • 解对于观测数据敏感\rightarrow \rightarrow正则化技巧

最小二乘问题:算子A奇异,条件数巨大,系统不相容等困难

min\left \| Ax-b \right \|_{2}

模糊类型(矩阵A的类型):

  1. Motion blur: 运动模糊
  2. Out-of-focus: 无法聚焦模糊

噪声类型(向量e的类型):

  1. Gaussian noise: 正态(高斯)噪声,最为常用
  2. Poisson noise: 泊松噪声
  3. Salt and pepper noise: 盐胡椒噪声

图像复原反问题:求解如下模型的清晰图片x

Ax+e=\hat{b}+e=b

其中模糊矩阵A和模糊图片b已知,噪声e未知,但噪声的值很小。既然噪声e很小(\left \| e \right \|_{2}=10^{-2}\left \| b \right \|_{2}),能否通过求解

Ax\approx b=\hat{b}+e,

得到的数值解x,作为清晰图片的近似?即计算

x=A^{-1}\hat{b}+A^{-1}e,

直除得到的结果模糊,不行

解决方法一:去掉模糊矩阵A中的小奇异值

  • 解决方法一的难点:究竟应该选择保留多少个大奇异值?即k的值如何选取。
  • 如果k太小,复原的图像不够清晰,细节没有体现出来。即出现欠拟合情形(under-fitting)。
  • 如果k太大,复原的图像被噪声污染,变得不清晰。即出现过拟合情形(over-fitting)。
  • 通过选择不同k,观察复原的图像清晰度,来粗略判断合适的k的选取。

解决方法二:Tikhonov正则化

Tikhonov正则化被广泛的应用于统计学,机器学习和深度学习,信号处理等领域。

对复原的解x有先验(prior)的物理假设,光滑性,稀疏性等等。不直接求解Ax=b,而是求解

min\left \| Ax-b \right \|_{2}^{2}+u^{2}\left \| x \right \|_{2}^{2}

其中:

  • \left \| Ax-b \right \|_{_{2}^{}}^{2}称为拟合项,衡量数据和模型的逼近程度;
  • \left \| x \right \|_{2}^{2}称为Tikhonov正则化项,避免过度拟合;
  • u>0是正则化参数,平衡拟合项和正则化项。

解决方法二的难点:如何选择合适的正则化参数u?

  • 如果u太小,复原的图像被噪声污染,变得不清晰。即出现过拟合情形(over-fitting)。极端情形u=0,则问题变回求解Ax=b。
  • 如果u太大,复原图像不够清晰,细节没有体现出来。即出现钱拟合情形(under-fitting)。极端情形u=∞,则问题和Ax=b无关。
  • 通过选择不同u,观察复原的图像清晰程度,来粗略判断合适的u的选取。

解决方法三:迭代法

数值迭代方法在很多科学计算领域有着广泛的应用,如机器学习,深度学习,数值代数,最优化等等。

迭代方法可以用来求解线性方程组

Ax=b

也可以用于求解最小二乘问题,或其他一般目标函数最优化问题

min\left \| Ax-b \right \|_{2}

迭代法一般形式,产生迭代序列\left \{ x_{k} \right \}_{k=0}^{\infty },最后收敛到解

x_{k+1}=x_{k}+\alpha _{k}\rho _{k}

常见的定常迭代方法:

  • Jacobi迭代,Gauss-Seidel迭代,SOR迭代等;

常见非定常迭代法

  • 梯度下降法(gradient descent)
  • 随机梯度下降法(stochastic gradient descent)
  • 共轭梯度法(conjugate gradient)
  • Kaczmarz方法,Cimmino方法

图像复原模型与算法总结

图像去模糊(复原)在数学上是一个不适定反问题,难度在于模糊矩阵接近奇异,且观测信号被噪声污染。

  1. 直接求解线性方程组,如左除,无法得到清晰的图像。
  2. 必须采用正则化方法,如截取奇异值分解法。
  3. Tikhonov正则化方法。
  4. 迭代方法。
  5. 不同方法有各自的优缺点。

图像去背景(Background Removal)

  • 一段视频(一系列图像)中,如何分别提取出背景(固定)部分和非背景(移动)部分?
  • 如何去除一张照片中无关的行人部分?
  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
一个基于GUI图像处理系统的图像处理算法模型结构可能包含以下几个主要的组件: 1. 图像输入模块:该模块用来接收用户输入的图像,可以从文件、相机、扫描仪等设备中读取图像数据,或者直接从剪切板中获取图像数据。 2. 图像预处理模块:该模块用来对输入的图像进行预处理,例如去除噪声、增强对比度、调整亮度、平滑图像等。 3. 特征提取模块:该模块用来提取图像中的特征,例如边缘、角点、纹理等。特征提取可以用于图像分类、目标检测、图像匹配等应用。 4. 图像分割模块:该模块用来将图像分割成不同的区域或对象。图像分割可以用于图像分析、目标跟踪、图像合成等应用。 5. 物体识别模块:该模块用来识别图像中的物体,并对其进行分类、识别。物体识别可以用于自动驾驶、智能安防、医学诊断等应用。 6. 图像重建模块:该模块用来将图像进行重建,例如去除噪声、恢复缺失的信息、增强图像质量等。图像重建可以用于数字图像修复、医学影像重建、工业检测等应用。 7. 图像输出模块:该模块用来将处理后的图像输出到屏幕、文件、打印机等设备上,或者将图像数据传输到其他应用程序中。 以上是一个基本的图像处理算法模型结构,不同的应用场景可能会有不同的组件和算法模块。同时,为了方便用户使用和调试,GUI图像处理系统还可以提供图像可视化界面、参数设置界面、算法调试界面等功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值