ISP图像对齐笔记(二):Deep Image Homography Estimation

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

ISP 图像对齐笔记(二):Deep Image Homography Estimation
Deep Image Homography Estimation 是 2016年的文章,很多博主也有相关学习,我这里写一些我的理解
还有,为什么选取这篇文章,我阅读了众多图像对齐内容,发现这篇文章虽然简单,但有理有据思路清晰,而且通过作者的介绍说效果不错。网络呢也简单,容易在DSP或者ISP上实现。


提示:以下是本篇文章正文内容,下面案例可供参考

一、4-点式建模与其利弊

其实作者的描述是:4-point homography parameterization,如果没有理解直接翻译会很直白没有内在的理解。其实作者是找到了一种将原图和warp图之间进行联系的桥梁,也就是一副图的四个角点,这是他的最巧妙的思路也是最制约本文拓展和在工业界实现根本问题。
在这里插入图片描述
如果这四个角点的位置在下图黄框内框起来的的范围改变
在这里插入图片描述
那么就是我们最基础的形变如下绿框所示。
在这里插入图片描述
那么问题来了2个:
(1)这里是个刚性变换,也就是四个点之间的连线都是直线,那么一般ISP镜头存在的曲面畸变,那么这个文章介绍的方法是无法可取的,同时作者也没说曲面怎么解决,但相关问题是可以解决的业内很多解决方案。

(2)这里建模时没有考虑辐照度、噪声的变化,也就是两幅图有个辐照度的差别时作者没说,造训练样本时也没说,但是文章结尾补了一句:
在这里插入图片描述
作者人为,环境(估计是亮度),噪声、运动模糊、遮挡都可以通过网络解决(估计是通过样本解决)

总之作者的思路是合理的只是有些状态非常理想,不是那种网络干了什么不知道但是就是效果好的设计。

二、原理过程

单应性变换有个最朴素的建模:
在这里插入图片描述
一般可以将其归一化后H33是个1,这里不赘述。那么变量也就是8个。

在这里插入图片描述
那么一般性的单应性变化过程可以描述为:
在这里插入图片描述
作者通过这个关系建立了,自己造出来的warp 和 求得的H阵。
但是这里光有了H阵怎么和训练建立联系?因为训练需要有个ground truth
因此作者有如下过程
在这里插入图片描述
假设我们原图是A,warp后的图是 B 那么HAB表示从A映射到warp 图B 上的 matrix阵。如果对这个HAB求逆,那么就是HBA
在这里插入图片描述
也就是HBA在warp图上根据warp图坐标系框出来的一定是个等价于原图A的这么一个图。这是个挺巧妙的思路。
恰巧是基于这个思路
其实作者才能将图片对齐用分类网络搞定(这里是VGG)
在这里插入图片描述
网络的前向层的计算量是完全可以部署在很多DSP或者带强计算算子的ISP上。

三、训练与效果

(1)除了上述创造性的过程外,作者还说了数据集就是COCO数据集,再次基础上不够的训练样本通过一张图上随机位置P、随机4个点的变化得到更多的训练样本。
(2)作者说了下网络结构,略。
(3)回归网络(regression network)和 分类网络(classification network)这里作者也提了下:
首先,回归网络在训练时,实际总结输出8个求解后的坐标值并且最后一层是欧式L2loss,优势是简单。但是问题在于没有很么很好的置信度用于预测,这种策略很容易不收敛。

然后是分类网络,用的最后一层是softmax,且loss 函数用的 交叉熵(详细见这里https://zhuanlan.zhihu.com/p/35709485)
这个方法确实能为每个图像角点产生置信度,详细见论文,这里不赘述。
在这里插入图片描述
但是从效果上看 作者说 regression 的要比 classification的要好
在这里插入图片描述
但总之用net的方式能比传统算法那好(我是没想到 orb+ransac 效果竟然可以这么好)


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Homography估计是一种计算机视觉技术,用于在两个平面之间进行几何变换。它可以用于图像配准、图像拼接、虚拟现实等应用中。Homography估计的目标是找到一个3x3的矩阵,将一个平面上的点映射到另一个平面上的点。这个矩阵可以通过多种方法来估计,包括最小二乘法、RANSAC等。 ### 回答2: Homography estimation是一种计算机视觉技术,指的是在图像处理中,通过计算两幅图像之间的变换关系,来实现不同图像之间的几何转换。这种技术可以应用于很多领域,包括但不限于机器人视觉、图像配准、增强现实、虚拟现实和数字图像处理等。 在homography estimation中,我们需要寻找两幅图像之间的变换矩阵。这个变换矩阵被称为幂律映射,可以将一幅图像的特征点集投影到另一幅图像的对应点集,从而实现两幅图像之间的几何变换。其中特征点可以是关键点、角点,也可以是一些其他算法提取出的特征点等。 常见的homography estimation算法有RANSAC和最小二乘法等。RANSAC算法是一种假设-验证的方法,它随机选择几个特征点,通过估计变换矩阵来验证这些点是否符合变换矩阵的假设。最小二乘法是一种基于矩阵代数的方法,通过最小化特征点之间距离的平方和来计算变换矩阵。 homography estimation的一个主要应用是图像配准。在医学影像、航拍影像、卫星影像等领域,需要将多幅图像进行配准,以实现更准确的测量和分析。homography estimation可以帮助我们计算不同图像之间的几何变换关系,从而实现图像的精确配准。 总之,homography estimation是一种重要的计算机视觉技术,它为图像处理和计算机视觉领域带来了很多便利和挑战。未来,随着人工智能和机器学习技术的不断发展,homography estimation将会得到更广泛的应用和深入的研究。 ### 回答3: homography estimation是指在计算机视觉中,通过图像对之间的空间变换关系来估计两个图像之间的投影映射。在计算机视觉领域中,对于单个图像来说,可以通过特征点的匹配关系来建立基础矩阵来描述两个图像之间的外参关系,而对于一组图像来说,则需要使用homography矩阵来描述它们之间的内参数和外参数关系。 homography estimation通常需要使用RANSAC算法来进行随机采样和模型拟合的过程,以确保对噪声和异常点有较好的鲁棒性和准确性。homography estimation主要应用于图像拼接、三维重建、目标跟踪、相机标定等领域,其优点在于适用于对于场景有较大的姿态变化、平面或近似平面场景、易于感知整个场景的视点调整等场景。同时,homography estimation也有其局限性,比如对于物体的旋转、缩放、形状变化等更为复杂的情况,其表现可能并不优秀。 总体来说,homography estimation可以为计算机视觉领域提供一种有效的图像对齐和重建的方法,有着广泛的应用场景和潜在的研究价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值