底层视觉与MMEditing

最新推荐文章于 2024-09-12 09:05:25 发布

travel?

最新推荐文章于 2024-09-12 09:05:25 发布

阅读量144

点赞数

文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/travel_66/article/details/131217834

版权

文章介绍了图像超分辨率技术，如SRCNN和FSRCNN，它们利用卷积神经网络提升图像清晰度。FSRCNN通过优化提升了运算速度。SRGAN和ESRGAN引入了对抗生成网络，增强图像细节的真实感。此外，还提及了视频超分辨率的EDVR模型，能处理复杂运动场景。

摘要由CSDN通过智能技术生成

这部分内容其实跟我们的实际生活很近，简单来说就是当我们看视频时会有不清晰的时候，怎样让其变清晰，又或者是很多年前的老照片，由于当时的技术不太成熟，得到的照片不太清晰，或者由于放置时间太长导致不清晰等等，我们如何将其变清晰。

图像超分辨率Super Resolution

什么是图像超分辨率？
就是把图像放大，恢复的很清晰。即根据从低分辨率图像重构高分辨率图像。
图像超分辨率的目标：

提高图像的分辨率
高分图像符合低分图像的内容
恢复图像的细节、产生真实的内容→双线性或双立方插值不能恢复图像的高频细节
超分辨率的类型：
多图超分：2倍放大，常见于遥感影像
单图超分

基于卷积网络的模型SRCNN与FSRCNN

使用卷积神经网络，端到端从低分辨率图像恢复高分辨率图像

SRCNN

SRCNN是首个基于深度学习的超分辨率算法，证明了深度学习再底层视觉的可行性。
模型仅由三层卷积层构成，可以端到端学习，不需要额外的前后处理步骤。
在这里插入图片描述
SRCNN的单个卷积层有明确的物理意义：
第一层：提取图像块的低层次局部特征；
第二层：对低层次局部特征进行非线性变换，得到高层次特征；
第三层：组合领域内的高层次特征，恢复高清图像。

SRCNN的训练

准备数据：将ImageNet数据集中的图像作为高分图像，降采样再插值升采样得到的图像作为低分图像。
需要学习的参数
损失函数：逐像素计算恢复图像和原高分图像的平方误差（Mean Squared Error,MSE）
通过标准的SGD训练模型

SRCNN的性能

在这里插入图片描述

FSRCNN

Fast SRCNN在SRCNN的基础上针对速度进行了改进：
1、不使用插值，直接在低分辨率图像上完成卷积运算，降低运算量
2、使用1×1的卷积层对特征图通道进行压缩，进一步降低卷积的运算量
3、若干卷积层后再通过转置卷积层提高图像分辨率

FSRCNN的优势

基于CPU进行推理，速度可以达到实时；
在处理不同上采样倍数时，只需要微调反卷积的权重，特征映射层的参数额可以保持不变，大幅加快训练速度。

损失函数

逐像素计算的损失函数

比较恢复图像与原始高分图像的每个像素值，并计算均方误差。
例如：SRCNN和FSRCNN中用到的均方误差损失（MSE Loss）
在这里插入图片描述

感知损失函数

比较恢复图像与原始高分图像的语义特征，并计算损失。
语义特征的计算由预先训练的神经网络模型给出。
例如：使用在ImageNet数据集上预训练好的神经网络计算语义特征。
在这里插入图片描述

特征重构损失函数

特征重构损失直接计算特征图之间的欧氏距离。
在这里插入图片描述

对抗生成网络GAN简介

对抗生成网络是一种基于神经网络的无监督学习模型，可以建模数据的分布，并通过采样生成新数据。

用神经网络表示数据分布

在这里插入图片描述

如何学习生成器网络

在这里插入图片描述

对抗训练

在这里插入图片描述

GAN的优化目标

在这里插入图片描述

基于GAN的模型SRGAN与ESRGAN

采用生成对抗网络的策略，鼓励产生细节更为真实的高分辨率图像。

SRGAN

SRGAN在SRResNet的基础上额外增加了判别器网络，用于区分训练集中的高分图像（真实图像）以及SRResNet恢复的高分图像（虚假图像）

SRGAN的训练

在这里插入图片描述

ESRGAN

Enhanced SRGAN从网络结构、感知损失、对抗损失三个角度对SRGAN进行了全面改进，在超分辨率效果上取得了很大的提升空间，同时获得了PIRM2018超分辨率挑战赛冠军。

使用RRDB模块替换残差模块

在这里插入图片描述

使用RaGAN替换GAN

在这里插入图片描述
使用非线性激活前的响应计算感知损失
原因1：激活后的响应值更稀疏，削弱监督信号的强度。使用更为密集的、激活前的响应计算感知损失有助于恢复图像中的细节信息。
原因2：使用激活后的响应容易使恢复图像产生亮度上的偏移。

ESRGAN的性能比较

在这里插入图片描述

视频超分辨率介绍

利用多帧进行超分。
视频复原的典型流程：
在这里插入图片描述

EDVR

适用于多种视频超分任务。为了处理快速而复杂的运动。
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
底层视觉与MMEditing

对抗生成网络是一种基于神经网络的无监督学习模型，可以建模数据的分布，并通过采样生成新数据。利用多帧进行超分。
复制链接

扫一扫

travel? CSDN认证博客专家 CSDN认证企业博客

码龄5年

12: 原创

138万+: 周排名

126万+: 总排名

5086: 访问

: 等级

123: 积分

1: 粉丝

3: 获赞

6: 评论

9: 收藏

私信

关注

热门文章

最新评论

深度学习预训练与MMPreTrain
CSDN-Ada助手: 恭喜您写出了这篇有关深度学习预训练与MMPreTrain的博客！您的文章非常有见地，阐述了一个很有意思的主题。我期待着您下一篇博客，希望您能够探索更多深度学习的领域，并分享您的发现和见解。无论您选择哪个主题，我相信您的文章将会给读者带来新的启示和思考。继续加油！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
安装MMPose&MMDetection教程及出现的一些问题及解决方案
CSDN-Ada助手: 非常感谢作者分享的安装MMPose&MMDetection教程及出现的一些问题及解决方案，对于我们这些初学者来说非常有帮助。恭喜作者已经写了第5篇博客，继续保持创作热情，分享更多优质的内容给大家。希望作者能够在下一步的创作中加入更多个人的思考和见解，让我们更好地理解并掌握相关知识。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
MMPretrain环境配置安装
CSDN-Ada助手: 非常感谢用户分享MMPretrain环境配置安装的经验，这将为其他人提供很大的帮助。恭喜您写了第6篇博客，持续创作是非常不易的，您已经展示了非常强的动力和才华。建议您在下一步的创作中可以深入探讨一些具体的实践案例，分享您在实践中的经验和教训，让读者更好地理解和应用相关技术。再次感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
目标检测与MMDetection
CSDN-Ada助手: 恭喜你写了这篇关于目标检测与MMDetection的博客！非常感谢你分享了这个主题，我觉得这对我们这些对机器学习和计算机视觉有兴趣的人很有帮助。我希望你能继续写下去，探索更多的机器学习领域，包括其他的目标检测算法和应用案例等等。希望你在未来的创作中能够继续保持谦虚的态度，让我们共同学习和进步。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。
语义分割与MMSegmentation
CSDN-Ada助手: 恭喜您写了第9篇博客，讲述了语义分割与MMSegmentation的相关内容。非常感谢您的持续创作，让我们从您的文章中学到了很多知识。接下来，希望您能够继续分享您的见解和经验，让更多人受益。期待您的下一篇文章，也希望您能够不断完善自己的写作技巧，给读者带来更好的阅读体验。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。