音视频开发之旅（71）- 人脸修复画质增强之GFPGAN

最新推荐文章于 2024-12-16 17:57:13 发布

音视频开发之旅

最新推荐文章于 2024-12-16 17:57:13 发布

阅读量2.6k

点赞数 11

分类专栏： AIGC 音视频开发之旅文章标签：音视频 AIGC stable diffusion

本文链接：https://blog.csdn.net/u011570979/article/details/136320293

版权

音视频开发之旅同时被 2 个专栏收录

103 篇文章

订阅专栏

AIGC

15 篇文章

订阅专栏

本文详细解析了GFPGAN的工作原理，包括其结构、loss函数和代码实现，同时比较了GFPGAN与CodeFormer在人脸图像恢复方面的优劣。介绍了如何在SDWebui中集成GFPGAN，并讨论了两者在不同场景下的适用性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、效果展示

二、GFPGAN原理浅析和代码实现分析

图片来源：https://arxiv.org/pdf/2101.04061.pdf

2.1 GFP-GAN框架概述

它由一个U-Net模块和一个预训练的人脸GAN模型组成。

GFP-GAN中为了保证人脸变清晰同时保持真实性，有四个loss

1. “Reconstruction Loss” 使用预训练的 VGG-19 网络来完成分辨率的增强

2. “Adversarial Loss” 使用 StyleGAN2 中类似的方法来生成逼真的纹理；

3. “Facial Component Loss” 为了让面部细节真实，使用辨别器单独生成和应用面部区块的补丁，特别处理了眼睛、嘴巴等局部细节；

4. “Identity Preserving Loss” 使用预训练的 ArcFace 模型，来帮助将原始图片中的身份特征恢复到 GFPGAN 生成的新图片中。

2.2 代码实现分析

2.2.1 模型加载

模型加载方面和CodeFormer基本一致：人脸检测模型retinaface_resnet50、背景超分模型realesrgan；以及人脸修复的GFPGAN模型

inference_gfpgan.py### 设置背景超分RealEsrGAN模型if args.bg_upsampler == 'realesrgan':    from basicsr.archs.rrdbnet_arch import RRDBNet    from realesrgan import RealESRGANer    model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64, num_block=23, num_grow_ch=32, scale=2)    bg_upsampler = RealESRGANer(        scale=2,        model_path='https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.1/RealESRGAN_x2plus.pth',        model=model,        tile=args.bg_tile,        tile_pad=10,        pre_pad=0,        half=True)  # need to set False in CPU mode

####  设置GFPGAN模型arch = 'clean'channel_multiplier = 2model_name = 'GFPGANv1.4'url = 'https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth'
model_path = os.path.join('experiments/pretrained_models', model_name + '.pth')restorer = GFPGANer(    model_path=model_path,    upscale=args.upscale,    arch=arch,    channel_multiplier=channel_multiplier,    bg_upsampler=bg_upsampler)        #gfpgan/utils.py 初始化人脸修复helper类（使用retinaface_resnet50模型） 提供人脸关键点检测、人脸裁剪对齐以及贴合原图等功能封装self.face_helper = FaceRestoreHelper(            upscale,            face_size=512,            crop_ratio=(1, 1),            det_model='retinaface_resnet50',            save_ext='png',            use_parse=True,            device=self.device,            model_rootpath='gfpgan/weights')

2.2.2 人脸修复

可以看到处理流程和CodeFormer完全一致：获取人脸5个关键点、对人脸进行摆正裁剪、进行人脸修复最后把修复后的人脸贴回原图

input_img = cv2.imread(img_path, cv2.IMREAD_COLOR)#返回人脸裁剪后图片cropped_faces；人脸修复后图片restored_faces以及人脸修复后贴回原图的图片restored_imgcropped_faces, restored_faces, restored_img = restorer.enhance(    input_img,    has_aligned=args.aligned,    only_center_face=args.only_center_face,    paste_back=True,    weight=args.weight)

restorer.enhance的实现在gfpgan/utils.py

self.face_helper.read_image(img)# 获取每个人脸的5个关键点self.face_helper.get_face_landmarks_5(only_center_face=only_center_face, eye_dist_threshold=5)#对人人脸进行摆正和裁剪处理self.face_helper.align_warp_face()
#对人脸进行修复for cropped_face in self.face_helper.cropped_faces:    # prepare data    cropped_face_t = img2tensor(cropped_face / 255., bgr2rgb=True, float32=True)    normalize(cropped_face_t, (0.5, 0.5, 0.5), (0.5, 0.5, 0.5), inplace=True)    cropped_face_t = cropped_face_t.unsqueeze(0).to(self.device)
    try:        output = self.gfpgan(cropped_face_t, return_rgb=False, weight=weight)[0]        # convert to image        restored_face = tensor2img(output.squeeze(0), rgb2bgr=True, min_max=(-1, 1))    except RuntimeError as error:        print(f'\tFailed inference for GFPGAN: {error}.')        restored_face = cropped_face
    restored_face = restored_face.astype('uint8')    self.face_helper.add_restored_face(restored_face)    #把修复后的人脸贴回原图    if not has_aligned and paste_back:    # upsample the background    if self.bg_upsampler is not None:        # Now only support RealESRGAN for upsampling background        bg_img = self.bg_upsampler.enhance(img, outscale=self.upscale)[0]    else:        bg_img = None
    self.face_helper.get_inverse_affine(None)    # paste each restored face to the input image    restored_img = self.face_helper.paste_faces_to_input_image(upsample_img=bg_img)    return self.face_helper.cropped_faces, self.face_helper.restored_faces, restored_img

三、SDWebui中使用

代码实现在 modules/gfpgan_model.py

#加载模型model_url = "https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.4.pth"models = modelloader.load_models(model_path, model_url, user_path, ext_filter="GFPGAN")
#人脸修复cropped_faces, restored_faces, gfpgan_output_bgr = model.enhance(np_image_bgr, has_aligned=False, onl