超分论文走读

AICVer

于 2024-05-29 11:41:30 发布

阅读量191

点赞数 3

分类专栏：超分深度学习文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011489887/article/details/139291209

版权

深度学习同时被 2 个专栏收录

61 篇文章 1 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

codeFormer

原始动机

高度不确定性，模糊到高清，存在一对多的映射
纹理细节丢失
人脸身份信息丢失

模型实现

在这里插入图片描述

训练VQGAN 从而得到HQ码本空间作为本文的离散人脸先验。为了降低LQ-HQ映射之间的不确定性，我们设计尽量小的码本空间和尽量短的Code序列作为人脸的离散表达。因此，我们采用了大的压缩比 (32倍)，即将原来的人脸图片压缩为的离散Code序列。该设计使得码本中Code具有更丰富的上下文信息，有助于提升网络表达能力以及鲁棒性。
嵌入Transformer模块，对特征全局建模，以达成更好的Code序列预测。该阶段固定Decoder和Codebook，只需学习Transformer模块并微调Encoder。将原本的复原任务转变为离散Code序列预测任务，改变了复原任务的固有范式，这也是本文的主要贡献之一。
引入权重控制，平衡图片质量与真实还原。当调小，模型输出质量更高；当调大，模型输出能保持更好的身份一致性。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
超分论文走读

codeFormer原始动机高度不确定性，模糊到高清，存在一对多的映射纹理细节丢失人脸身份信息丢失模型实现训练VQGAN 从而得到HQ码本空间作为本文的离散人脸先验。为了降低LQ-HQ映射之间的不确定性，我们设计尽量小的码本空间和尽量短的Code序列作为人脸的离散表达。因此，我们采用了大的压缩比 (32倍)，即将原来的人脸图片压缩为的离散Code序列。该设计使得码本中Code具有更丰富的上下文信息，有助于提升网络表达能力以及鲁棒性。嵌入Transformer模块，对特征全局建模，以达成
复制链接

扫一扫

专栏目录

AICVer CSDN认证博客专家 CSDN认证企业博客

码龄11年

229: 原创

2万+: 周排名

5499: 总排名

66万+: 访问

: 等级

6256: 积分

190: 粉丝

289: 获赞

109: 评论

1010: 收藏

私信

关注

热门文章

分类专栏

最新评论

pytorch与cuda版本对应关系汇总
ZYZ_123BlueEye: https://pytorch.org/get-started/previous-versions/
pytorch与cuda版本对应关系汇总
qq_45783949: https://github.com/pytorch/vision#installation
Ubuntu下vscode配置OpenCV以及Libtorch
longchengyun: make到一半提示找不到头文件啊..快疯了
主成分分析（PCA）与奇异值分解（SVD）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录。
pytorch与cuda版本对应关系汇总
ppxx07: 请问哪里能查最新的这个表啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AICVer 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。