超分损失函数小结

原论文:Deep Learning for Image Super-resolution: A Survey

1.Pixel Loss:用来度量生成图片和目标图片的像素级的差异

1.1 L1 loss

 1.2 L2 loss

 

1.3 Charbonnier loss:L1 Loss的变体,最后参数是一个很小常量(e.g., 1e − 3),为了使数值稳定

 

像素损失是最常见的损失,通常L2损失能够对大的损失进行惩罚,但是在小的损失上无能为力,效果不如L1,像素损失实际上并没有考虑到图像质量(如感知质量,纹理),经常缺乏高频细节,并且产生的纹理过于平滑,难以令人满意

2.Content Loss:如果一个网络,生成的图像足够逼真,那么生成图片的特征(度量特征提取网络中提取的)也应该跟真实图片的足够像,因此通过使特征足够相似,对生成图片质量也有促进作用

 

 l是网络第l层,常用的度量特征提取网络有vgg,resnet。

3.Texture Loss:由于重建后的图像应该与目标图像具有相同的样式(例如,颜色、纹理、对比度),将图像的纹理视为不同特征通道之间的相关性(用矩阵点乘来表示相关性)

 

最终损失函数是要求相关性相同:

 

 

好用是好用,但是需要通过经验(调参)来确定patch的大小,patch太小会造成纹理部分 artefacts(重影),太大会造成整个图片重影。(因为纹理统计是对不同纹理区域求平均值)

4.Adversarial Loss:这就不用多说了,不服就GAN嘛

4.1 loss based on cross entropy

 

 

 4.2 loss based on least square error

 

 4.3 hinge-format adversarial loss

 

 像素级的判别器会使生成器产生高频噪音,但是特征级的判别器可以很好的捕捉高清图片的潜在属性

其中比较重要的工作有:

“Learning to super-resolve blurry face and text images”合并一个多类GAN,包括单个生成器和特定于类的鉴别器

ESRGAN[101]利用 relativistic GAN[131]来预测真实图像比假图像相对真实的概率,而不是预测输入图像真实或生成的概率。

虽然经过GAN处理后的图片PSNR会低一点(相比pixel loss)但是在感知质量上带来了显著的提高。鉴别器提取了真实图像中一些难以获得的潜在特征,并推动生成的HR图像符合这些模式,从而有助于生成更真实的HR图像

GAN相比其他模型,训练上会比较困难,仍是目前未解决的一个问题

5.Cycle Consistency Loss:

 

 

 受CycleGAN启发,将HR图像通过另一个CNN网络缩小成I‘,然后跟要处理的小图片做相似性度量

6.Total Variation Loss:

 

 两点作用:1.抑制噪音(主要是噪点),2.提升图像的空间平滑性

7.Prior-Based Loss:基于先验的损失

  Super-fan: Integrated facial landmark localization and super-resolution of real-world low resolution faces in arbitrary poses with gans 

  聚焦于人脸图像的SR,并引入了人脸比对网络(FAN)来约束从原始和生成的图像中检测到的人脸地标的一致性

 

实践中经常是多个损失函数组合使用,但是权重调节是一个大问题,对结果有决定性的影响,需要各位炼丹师自己去摸索了

2019年11月21日更新

图片超分的方法对视频超分不是很合适,因此又推出了新的度量标准

Video Multimethod Assessment Fusion (VMAF)

https://medium.com/netflix-techblog/toward-a-practical-perceptual-video-quality-metric-653f208b9652

The current version of the VMAF algorithm and model (denoted as VMAF 0.3.1), released as part of the VMAF Development Kit open source software, uses the following elementary metrics fused by Support Vector Machine (SVM) regression [8]:

  • Visual Information Fidelity (VIF) [9]. VIF is a well-adopted image quality metric based on the premise that quality is complementary to the measure of information fidelity loss. In its original form, the VIF score is measured as a loss of fidelity combining four scales. In VMAF, we adopt a modified version of VIF where the loss of fidelity in each scale is included as an elementary metric.
  • Detail Loss Metric (DLM) [10]. DLM is an image quality metric based on the rationale of separately measuring the loss of details which affects the content visibility, and the redundant impairment which distracts viewer attention. The original metric combines both DLM and additive impairment measure (AIM) to yield a final score. In VMAF, we only adopt the DLM as an elementary metric. Particular care was taken for special cases, such as black frames, where numerical calculations for the original formulation break down.

VIF and DLM are both image quality metrics. We further introduce the following simple feature to account for the temporal characteristics of video:

  • Motion. This is a simple measure of the temporal difference between adjacent frames. This is accomplished by calculating the average absolute pixel difference for the luminance component.

 

9.H. Sheikh and A. Bovik, “Image Information and Visual Quality,” IEEE Transactions on Image Processing, vol. 15, no. 2, pp. 430–444, Feb. 2006.

10.S. Li, F. Zhang, L. Ma, and K. Ngan, “Image Quality Assessment by Separately Evaluating Detail Losses and Additive Impairments,” IEEE Transactions on Multimedia, vol. 13, no. 5, pp. 935–949, Oct. 2011

  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在图像超分辨率重建任务中,损失函数正则化是一种常用的技术,用于约束生成的高分辨率图像与真实图像之间的差异,并提高重建图像的质量和细节。 常见的损失函数正则化方法包括以下几种: 1. 均方误差(MSE)正则化:MSE是最常用的损失函数之一,用于衡量生成图像与真实图像之间的像素级差异。通过最小化MSE损失,可以使生成图像尽量接近真实图像。 2. 感知损失(Perceptual loss)正则化:感知损失是通过计算生成图像和真实图像之间的感知差异来衡量重建图像的质量。常用的感知损失基于预训练的深度学习模型(如VGG网络)提取的特征表示,通过比较特征之间的差异来计算感知损失。感知损失可以帮助保留图像的结构和语义信息。 3. 对抗损失(Adversarial loss)正则化:对抗损失是通过引入生成对抗网络(GAN)来约束生成图像的质量。生成器网络试图生成逼真的高分辨率图像,而判别器网络则试图区分生成图像和真实图像。通过最小化生成器和判别器之间的对抗损失,可以提高生成图像的逼真度和细节。 4. 边缘保持正则化:边缘保持正则化是一种通过保持图像边缘信息来约束生成图像的方法。边缘保持正则化方法通常基于图像的梯度信息,通过最小化梯度差异来保持图像的边缘清晰度。 综合使用这些正则化方法可以提高图像超分辨率重建任务的性能,使生成的高分辨率图像更加清晰和逼真。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值