分离潜变量自动编码器超分辨率网络 SLAESR

最新推荐文章于 2024-06-30 19:35:32 发布

ONE_SIX_MIX

最新推荐文章于 2024-06-30 19:35:32 发布

阅读量523

点赞数

分类专栏：神经网络文章标签： SLAESR 超分辨率自编码器 AE SR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/one_six_mix/article/details/98403743

版权

神经网络专栏收录该内容

33 篇文章 0 订阅

订阅专栏

分离潜变量自动编码器超分辨率网络
Separating latent automatic encoder super-resolution network.
简称：SLAESR

关于训练部分，请看仓库
github 仓库：https://github.com/One-sixth/SLAESR

这名字听着有点Cool，: )

设计原因和目的：
有一大堆128x128的动漫头像，要把他们的分辨率弄到512x512那里去，又不想使用waifu2x。
经过观察，这些头像信息量不高，我把他们下采样到64x64，看起来仍然很清晰。那么，把他们上采样到高分辨率时，只要让其边缘清晰，和颜色过渡平滑即可。所以使用自编码器。相比wdsr结构，占用显存应该会少很多。因为动漫头像没有复杂的纹理的，估计足够了。并且，自动编码器可以自动丢弃一些不重要的特征。也许可以主动去噪？
受到 VQVAE 的结构启发。
不过后面发现，上采样动漫图像效果也不错。

模型差异：
模型1：使用 Deconv 2x2 作为上采样层，颜色对比度高，但是有微弱伪影，使用conv 1x1 或 conv 3x3 和 PixelShuffle 组合也有微弱伪影，不知为何。
模型2：使用 Conv 3x3 和 Bilinear Upsample 组合作为上采样层，终于没有那坑爹的伪影。但是色彩对比度较差。。
模型3：相比模型2，换成了 Nearest Upsample。然后，好的地方没啥区别，有的地方甚至更差。。。所以不公开了

训练：
dataset: https://github.com/ANIME305/Anime-GAN-tensorflow#open-sourced-dataset
loss: ssim & l1
train_resolution: 64x64 -> 128x128

训练方式是把图像用Area下采样到64x64，再由网络上采样到128x128
数据增强方式，RGB通道乱序，随机亮度。

训练样本

model_1:
64->128
在这里插入图片描述
128->256, 仅测试，不进行训练。

model_2:
64->128
在这里插入图片描述
128->256, 仅测试，不进行训练。

大图像超分辨率测试

模型1可观察到头发处有颜色断层
模型2则非常平滑

原图：

在这里插入图片描述

模型1：
在这里插入图片描述

模型2：

网络结构

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。