DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记

最新推荐文章于 2024-10-23 16:44:18 发布

小王不头秃

最新推荐文章于 2024-10-23 16:44:18 发布

阅读量3.8k

点赞数 10

分类专栏：图像融合图像处理文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43627076/article/details/127271297

版权

图像处理同时被 2 个专栏收录

23 篇文章

订阅专栏

19 篇文章

订阅专栏

DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs 阅读笔记

引言
介绍
- 主要贡献
提出的方法
待续
参考

论文地址：https://arxiv.org/abs/1712.07384

如有侵权请联系我们

引言

文章中提出了一种基于深度学习架构，用于融合多曝光图像的算法

在神经网络的训练过程，一般都是监督学习，这样训练出的神经网络都有很不错的效果。但是由于没有足够的数据集供其使用，所以该篇论文提出了无监督的MEF（多曝光融合）深度学习框架。

介绍

首先引入HDRI的概念，这是一种存储图像的格式，相对于RGB格式来说，HDRI有更大的亮度范围，图像会更好，更清晰。

比较流行的生成HDR图像的方法被称为MEF（多次曝光融合），该方法就是将具有不同曝光的多个LDR图像（例如我们熟知的jpg，png等）融合为一个HDR图像。不同曝光的多个LDR文件也被称为曝光堆栈。

如果曝光堆栈中多个图像之间的曝光偏差最小时，大部分的MEF算法都可以取得不错的效果。但是这就带来了一个问题，曝光偏差小时，就意味着我们需要更大的存储容量以及更长的处理时间，论文中的方法是直接输入一个图像对，曝光偏差可以很大，该论文在这种情况下也可以工作的不错。

主要贡献

一种基于CNN的无监督图像融合算法，用于融合曝光叠加静态图像对。

一个新的基准数据集，可用于比较各种MEF方法

针对各种自然图像的7种最新算法的广泛实验评估和比较研究

提出的方法

总体架构

论文中使用的是使用CNN的图像融合框架。

为什么使用CNN？
因为CNN可以通过损失函数来自动更新网络中的参数，使得输出的结果不断地逼近预测值，运用在图像融合上也是一样，通过我们设定好的损失函数，CNN的输出图像结果就会逐渐趋近我们希望的结果。

主要流程

将输入曝光堆栈转换为YCbCr色通道数据。CNN用于融合输入图像的亮度通道。这是因为亮度通道中存在图像结构细节，亮度通道中的亮度变化比色度通道中的明显。

获得的亮度通道

网络结构

在这里插入图片描述
如上所示，特征提取层（C11，C21，C12和C22），融合层（Tensor addition）和重构层（C3，C4，C5）。

输入的Y1和Y2分别为曝光不足和曝光过度的图像。

C11和C12，C21和C22的参数是共享的，这有什么好处呢？
从另一角度来说C11，C21和C12，C22提取的特征是相同的，这就使得提取出的F11和F21可以通过融合层直接融合。这里融合的策略是直接相加。

损失函数

因为MEF没有预期的输出图像，因此像监督学习中使用的各种损失函数，在这里就不适用了，这里使用MEF SSIM作为损失函数，详情可参考以下论文。

K. Ma, K. Zeng, and Z. Wang. Perceptual quality assess-
ment for multi-exposure image fusion. IEEE Transactions
on Image Processing, 24(11):3345–3356, 2015.

在这里插入图片描述

如上图，yk代表表示在输入图像p像素位置周围提取的块，这里k属于（1，2），即代表一张高曝光和曝光不足的图像；uyk代表yk的平均值，Ck代表yk这里的对比度，Sk代表结构，Lk代表亮度

知道了以上公式之后我们再往下看

对比度越高，图像越好，因此这里c hat（就是c的预测值）就是两张图像中yk中的最大的c

在这里插入图片描述

结构的预测值公式如下

在这里插入图片描述

总体的y的预测如下
在这里插入图片描述
由于局部面片中的亮度比较不重要，因此从上述等式中删除亮度分量（文章中提到的，不是很理解）

以上都是为损失函数做铺垫，接下来才到了真正的损失函数

在这里插入图片描述

σ2y hat 是y hat的的方差，σy hat yf是是二者之间的协方差，N是图中像素总数

以上就是对论文中的损失函数的介绍了

训练

训练数据
25个公开的曝光堆栈+50个不同场景特征的曝光堆栈，每个场景由两个LDR图像组成。

在这些堆栈中剪裁了30000个大小为64*64的图像用于训练。

训练参数
学习率为10的-4次方，经过100次训练，每次训练所有的数据

测试

遵循标准的交叉验证程序来训练模型，并在不相交的测试集上测试最终模型。

图像的关键细节主要再Y通道上，因此Y通道和Cb/Cr所采用的融合策略是不同的

此外，MEF SSIM损失被公式化以计算2个灰度（Y）图像之间的得分

不知道大家有没有和我一样的疑惑，这里为什么是计算两个灰度图像之间的得分，来看下百度给结果
在这里插入图片描述
前文中我们已经提到了，论文中的方法主要是融合Y通道，这就很明朗了。

小细节

这里和之前阅读的一篇论文中一样，都需要对输入的图像进行配准和对齐，因为在采集过程中，不可避免的会出现摄像机和物体的移动。另一篇论文
这里的相加策略中是单纯的相加，这时候我们想如果在两张图像中，一张图像中的特征是我们希望在融合时占的比重较大，另一张占的较小，这样实现起来也许融合图像的效果会更好，但是这就要我们计算融合时的权重了，而经过论文作者的测试，发现增加C3后的过滤器和层数也可以达到这个效果。（神经网络yyds）

待续

关于实验结果以及总结部分，这里就不赘述了，大家有兴趣可以看一下

文章读的比较糙，因为我的目的主要是想了解这个MEF SSIM损失函数，大家如果有兴趣的话建议好好读一下，非常好的论文

参考

[1] DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme
Exposure Image Pairs

小王不头秃

博客等级

码龄7年

后端领域新星创作者

126
原创

1771
点赞

6142
收藏

6425
粉丝

关注

私信

热门文章

分类专栏

设计模式 4篇
图像融合 19篇
爬虫 9篇
跟着小王一起刷leetcode 5篇
leetcode刷题 2篇
源码 1篇
图像处理 23篇
深度学习 18篇
JVM修仙之路 2篇
opencv 2篇
软件工程 1篇
jvm 3篇
python 15篇
后端 14篇
背吧
工具 5篇
java 24篇
前端 7篇
笔记 1篇
harmony 2篇
微服务 11篇
数据结构 6篇
c/c++ 5篇
mysql 2篇
nginx 2篇
android 3篇
security 3篇

展开全部收起

最新评论

python爬虫入门案例，持续更新
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/boost_spider 依托于funboost的强大可视化管理，不登录机器可以轻松掌控分布式大规模爬虫运行状态，一目了然。可视化截图： https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html
红外与可见光图像融合入门教学
亦初^: 我想问一下有些文献训练集的红外和可见光都三通道输入网络的也是三通道，但是后面做泛化实验的时候选的比如tno这些数据集它里面红外是单通道的，这样直接拿来融合应该不行啊，而且单通道红外如果硬把它变成三通道图像质量也不一样了，有没有大佬解惑
【读论文】PIAFusion
年zz: 请问有这样的数据集吗？另外图像重建为什么最后的输出通道是1。。。
【读论文】SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer
夏日冰甜汽水*^O^*: 对于弱对齐，就是只有目标区域对齐，可能大小略有差异，可以使用吗，想用到多模态目标检测上去
【读论文】Real-time infrared and visible image fusion network using adaptive pixel weighting strategy
2301_78292265: 能交流一下吗

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小王不头秃 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。