无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数

最新推荐文章于 2024-09-29 22:12:49 发布

放牛娃子

最新推荐文章于 2024-09-29 22:12:49 发布

阅读量2.1k

点赞数 1

分类专栏：视觉里程计 depth estimation 文章标签：深度学习自动驾驶计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22751305/article/details/110916554

版权

视觉里程计同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

depth estimation

4 篇文章 0 订阅

订阅专栏

在自监督深度估计中，一般输入2张图像（若为视频，则输入邻近的两帧图像）frame1和frame2，模型先估计相机拍摄这2张图像是的姿态变化pose，然后根据pose将frame1变换到frame2的视角下，得到合成图像synthetic frame1。

估算的pose越准确，synthetic frame1与frame2的图像相似度就越高。那么，常用SSIM（结构相似性）来评价这两张图片的相似度。

若希望详细了解单目深度估计，可参考文章《动态场景下的单目深度估计》、《Instance-wise Depth and Motion Learning from Monocular Videos》和《MonoDepth2_单目深度估计》。

SSIM

用于检测两张尺寸相同的图像的相似度，它主要通过分别比较两个图像的亮度(l)、对比度(c)、结构(s)，然后对这三个要素加权并乘积表示，在论文中这三个要素用下面公式来表示：

这里 μx 为均值，σ 为方差，σxy 表示协方差。这里 C1、C2、C3 是为了避免当分母为 0 时造成的不稳定问题（所以写算法的时候可以放心，一定不会出现除 0 的情况）。

而 SSIM 的一般方程为：

这里一般 $\alpha$ , $\beta$ , $\gamma$ 取1，并且令 C3=0.5*C2，这样就得到简化的 SSIM 公式：

c_1=(k_1*L)^2，c_2=(k_2*L)^2是用来维持稳定的常数。L是像素值的动态范围。k_1=0.01,k_2=0.03。
结构相似性的范围为-1到+1（即SSIM∈(-1, 1]）。当两张图像一模一样时，SSIM的值等于1。

tensorflow实现代码，戳here，滑至末尾

pytorch code

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。