论文阅读笔记
文章平均质量分 86
生成式AI,计算机视觉
JM-0808
本科在读
-AI算法实习生ing
展开
-
Memories are One-to-Many Mapping Alleviators in Talking Face Generation
论文:paper原创 2023-07-02 16:56:00 · 52 阅读 · 0 评论 -
Efficient Geometry-aware 3D Generative Adversarial Networks
利用单张图片,通过无监督的方式生成多角度协同的视图和对应的3D图仍存在很大的挑战当前的3D GANs模型存在两点不足:1.所需计算资源巨大–限制了其实际应用和可输出分辨率;2.采用估计的方法而非3D协同(没有采用一个点一个点的方法去生成整张3D视图)–无法做到真正的多角度协同。作者提出了一种高效的,显示-隐式混合的模型,可以实时生成高分辨率的多角度协同视图以及对应的3D视图。原创 2023-06-20 00:05:12 · 186 阅读 · 0 评论 -
A Style-Based GAN Encoder for High Fidelity Reconstruction of Images and Videos--论文笔记
作者设计了一种新的encode模型框架,不同于以往的encoder只为GAN提供一个latent code,作者所设计的encoder有两条分支的输出,第一条和以往的encode模型一样提供latent code,另一条分支提供feature tensor。作者提到,这个feature tensor是GAN能生成高质量图片/视频的关键。大量的实验证明作者所提出的框架在多个数据集上面达到了SOTA效果。原创 2023-06-14 22:29:17 · 133 阅读 · 1 评论 -
MyStyle: A Personalized Generative Prior-论文
MyStyle:个性化人像生成式先验。论文提出MyStyle模型框架,一种用数十张个人照片训练的个性化深度生成式先验。MyStyle允许重建、增强和编辑特定人物图像,使输出高度保留此人的关键人脸特征。首先先在大数据集(FFHQ)训练StyleGAN,随后,在给定一小部分人像图像的参考集(100张),调整预训练StyleGAN人脸生成器的权重,在潜空间形成一个局部、低维、个性化流形。该流形构成了一个个性化区域,跨越了与个人不同肖像图像相关的潜代码。原创 2023-06-06 16:14:24 · 229 阅读 · 0 评论 -
DiffusionRig: Learning Personalized Priors for Facial Appearance Editing
作者团队解决了一个问题:从特定人物的小批量数据集(大约20张左右)学习到个性化的先验信息,从而允许模型(DiffsuionRig)对特定人物在保持个性轮廓信息、细粒度信息的同时进行更细致的人脸编辑包括光照、表情等。具体来说,DiffusionRig是一种基于扩散模型的方法,其模型是由从现有图像估计的简化的3D面部模型条件化或“装配”的。DiffusionRig首先从大规模面部数据集中学习通用的面部先验知识,然后从感兴趣人物的少量肖像照片集合中学习个体特定的先验知识。原创 2023-06-05 21:27:04 · 529 阅读 · 1 评论