【论文笔记】(VC)Multi-scale Grouped Dense Network for VVC Intra Coding

Multi-scale Grouped Dense Network for VVC Intra Coding

问题

为了降低伪影

方法

提出了一个 the multi-scale grouped dense network (MSGDN)
包含了多尺度和组密集模块
提出 a generative adversarial network (MSGDNGAN) 利用MSGDN作为生成器,以提高主观质量

分析

VVC中,编码单元的尺寸是不同的,因此造成压缩伪影分布在不同的空间尺寸上。因此采用多尺度
为了增强网络的表征能力,使用GRDB作为每个尺度的基本模块
为了增强压缩图像的主观质量,提出使用GAN


Multi-scale grouped dense network

通过不同尺度特征,网络可以融合粗粒度和细粒度信息去增强表达能力
在这里插入图片描述
突然他这引用的这篇文章 《Grouped residual dense network for real image denoising and gan-based real-world noise modeling》和作者写的几乎一样呀,除了多了一个多尺度结构。

每个低尺度特征经过一个GRDB后,上采样与上一尺度特征融合,并经过一个Non-local模块,这里Non-local 模块的作用是什么呀?文中未说明。

Generative adversarial network for VVC

以前我就想做一个有关GAN的网络来增强主观质量,没想到已经有人捷足先登了

文中使用上述的MSGDN作为generator
使用Relativistic average Discriminator(RaD) 增强鉴别器, RaD专注于输入数据是否更真实

x r x_r xr x f x_f xf 分别代表real image and fake image
the discriminater loss:
在这里插入图片描述
E x r E_{x_r} Exr 是一个minibatch中所有real data 的平均值
在这里插入图片描述
f f f代表 sigmoid 函数, C代表discriminator的输出。
同时还采用perceptual loss[14] 进一步约束主观性能

GAN虽然提高了主观质量,然而造成了客观质量的下降


Loss Function

为了提升客观性能,文中首先使用L1 losss,然后再用MSE loss微调MSGDN模型。
这样对于只用MSE来说,有什么好处吗,

为了提高主观性能,首先使用L1 loss 训练生成器,再用公式3中的loss替换L1 loss
在这里插入图片描述

Experiment

作为VVC的研究,竟然不用CTC测试,差评,要是我,肯定拒了!

在这里插入图片描述

在这里插入图片描述
这个GAN提升的主观质量还真可以

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值