【前言】
前几天吃了一下ICCV21的瓜,吃的有点饱,就去刷了一下arxiv,看到了一篇微软的工作,很有意思,是Mobilenet和Transformer的拼一起的网络架构,具体说就是这两个网络主干就类似梯子的两条腿,腿之间的踏板是Mobilenet跟Transformer的数据同步的子模块设计。按照他写的Mobilenet那里不知道用的是V几的,Tranformer用的是ViT的,给的性能是,Flops比Mobilenet V3和LeVit都小,但是分类Top-1都要更高,原本觉得很有意思,想要读一读跑一下的,但好像因为文章比较新,才贴了几天,没给github开源,而我本人对Transformer不太懂,自己实现好像也不太好做,那就算了,等后面他开源了这个网络我再看。这次看个比较老的工作的,自监督的图像增强网络,只需要用暗光图像训练就可以了。这个Paper有个问题,好像是因为他没做去噪的工作,被拒了,作者们后面重写了一版带去噪的才中稿,但这里我们还是继续看这个没中稿的吧,这个比较有意思。
以下解读与见解均为我的个人理解,要是我有哪里曲解了,造成了不必要的麻烦,可以联系我删除文章,也可以在评论区留言,我进行修改。也欢迎大家在评论区进行交流,要是有什么有意思的paper也可以留言,我抽空看一下也可以写一些。正文内容中的“作者”二字,均是指paper的作者,我的个人观点会显式的“我”注明。而文中的图基本都是从paper上cv过来的,我也没本事重做这么多的图,况且作者的图弄得还挺好看的。
Paper基本信息
题目:Self-supervised Image Enhancement Network: Training with Low Light Images Only
作者:Yu Zhang, Xiaoguang Di, Bin Zhang, Chunhui Wang, 是来自HIT的研究团队
链接:https://arxiv.org/abs/2002.11300arxiv.org/abs/2002.11300
总结:暗光成像的真实环境数据集+基于CNN的暗光成像端到端模型
Paper内容介绍
【Introduction】
这几年