RestoreFormer

本文链接：https://blog.csdn.net/qq_43288373/article/details/134184069

本文介绍了一种名为RestoreFormer的深度学习模型，使用全空间注意力机制处理低分辨率图像，融合高分辨率先验信息，通过多层损失函数提高重建质量。实验在FFHQ数据集上进行，包括HQDictionary的预训练和RestoreFormer的后续训练阶段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Fully-spatial attentions to model contextual information

Model

在这里插入图片描述
(a) MHSA-multi-head self-attention, q k v 都是来自degraded Zd
(b) MHCA-multi-head cross-attention, 在空间上融合了degraded Zd和和其对应高分辨先验Zp
© RestoreFormer pipeline,

Encoder Ed从低分辨图Id中提取特征Zd
从HQ Dictionary中获取最近的高分辨先验Zp
利用两个MHCA来融合低分辨率特征Zd和高分辨率先验Zp
Decoder Dd被用来从融合的特征Zf’来重建高分辨率的face Id

HQ Dictionary

一个面部的高质量字典，在面部重建过程中，提供更丰富的面部细节，比如眼睛和嘴巴。
在这里插入图片描述

Learning

Total Loss
Pixel-level losses : L1 loss and perceptual loss

Ih is gt high-quality image, phi is the pretrained VGG-19
特征Loss
Encoder提取的特征Zd和获取的先验Zp
Component-level losses
在面部，包括嘴巴、眼睛，采用判别器损失和特征风格来进一步增强复原的质量