画质增强概述-3.1-AI增强实践之超分训练

何亮-1108

已于 2022-03-29 10:30:59 修改

阅读量3.3k

点赞数

分类专栏：图像处理视频云画质增强文章标签：深度学习画质增强计算机视觉视频云图像处理

于 2022-03-16 16:20:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/heliang1108/article/details/123522187

版权

视频云同时被 3 个专栏收录

8 篇文章 2 订阅

订阅专栏

7 篇文章 2 订阅

订阅专栏

6 篇文章 2 订阅

订阅专栏

三画质增强的AI增强实践

画质增强处理从方法上可以分为传统方法和深度学习(AI)方法，他们是互相补充的关系，传统方法相对而言性能会好些，AI方法吃GPU、吃算力，很多课题AI方法效果远非传统方法科比，典型的如超分、超帧(频率上采样)、补全、降噪等等，这篇重点介绍AI方法的超分实践，主要分三部分：训练、推理和应用

3.1 训练

3.1.1 超分主干网络

对超分历年比较经典的主干网络做了一次梳理和调研，如下图

这个梳理和调研还是有非常大价值的，然后把他们预训练模型用自己真实场景的素材跑一遍看下效果，另外主干网络的代码一般都不会很复杂，对照论文和代码自己过一遍，一般就有数了，我最终超分选择的主干网络是 RCAN，选择的训练开源框架是 KAIR，github 链接如下： https://github.com/cszn/KAIR

当然 KAIR 生成网络不支持RCAN，可以自己加上去，也不复杂。

这里值得提一下的项目是阿里的 GPEN (图片人脸增强，效果着实惊艳，可惜不太适合做视频人脸增强)

3.1.2 数据集

常见数据集如下：

人脸以 FFHQ 为主

通用场景是 DIV2K、Flickr2K、商汤的OST

屏幕内容是我自制数据集，主要是屏幕截图所得

3.1.3 数据预处理

数据预处理是在超分同时，实现降噪、去模糊、去马赛克等处理的关键

不同场景的模型，训练所需的数据集是不同的，且对应的数据预处理方式也不同，场景定制模型的化，采用特定数据集加特定预处理方法，一般而言收益可以比较显著：模型效果更好、模型参数可以更少，典型的是我训练的屏幕内容超分模型，数据集用的是自己电脑截图的PNG图片，模型也不大，pth 大约几百k，提升效果却非常显著，如下图

3.1.4 训练过程及损失函数

KAIR中，一般是先只训练生成器，损失函数主要是 PSNR，然后在此基础上再加入判别器继续二阶段训练，该阶段一般会新增两个损失函数，分别是感知损失和判别器损失

3.1.5 训练中的常见问题

从我自己的经验，训练主要障碍是超分生成的图片容易失真，不自然

现在主流的做法，基本都会采用 GAN 的方式来训练超分网络，那么判别器损失是需要重点关注的指标，该损失过小，意味着生成的图片失真比较严重

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
画质增强概述-3.1-AI增强实践之超分训练

三画质增强的AI增强实践画质增强处理从方法上可以分为传统方法和深度学习(AI)方法，他们是互相补充的关系，传统方法相对而言性能会好些，AI方法吃GPU、吃算力，很多课题AI方法效果远非传统方法科比，典型的如超分、超帧(频率上采样)、补全、降噪等等，这篇重点介绍AI方法的超分实践，主要分三部分：训练、推理和应用3.1 训练3.1.1 超分主干网络对超分历年比较经典的主干网络做了一次梳理和调研，如下图这个梳理和调研还是有非常大价值的，然后把他们预训练模型用自己真实场景的素材跑一遍看
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。