自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 论文分享-index

GAN可解释性语义编辑SeFa

2021-03-04 09:44:38 146 1

原创 [CVPR2021]Encoding in Style a StyleGAN Encoder for Image-to-Image Translation

注:拉到最后有视频版哦~论文地址:https://github.com/eladrich/pixel2style2pixel这次给大家介绍一篇CVPR2021的论文,主要讲的是基于StyleGAN的encoder网络,能做inversion,图像翻译等任务我会从这7个方面开始我的讲解背景首先是背景,GAN在图片生成领域取得了很好的效果,尤其是现在最经典的StyleGAN,同时StyleGAN又有解耦合的latent space,有很多方法已经能通过操纵latent space来做

2021-07-31 21:56:35 1385

原创 【IJCV2020】【语义编辑】Semantic Hierarchy Emerges in Deep Generative Representations for Scene Synthesis

注:拉到最后有视频版~论文地址:https://genforce.github.io/higan这次给大家分享一篇做场景编辑的文章,作者是周博磊老师组的杨策元,中的是 IJCV2020我会从这五个方面开始我的讲解背景首先是背景,背景就是 GAN 在图片合成领域表现优异动机动机是现在目标检测的解释性工作比较多,对于 GAN 这种生成模型的解释性工作还比较少目标研究目标是探究下语义层级信息在 layer-wise 输入的 GAN 模型中的表现,这里可以看.

2021-04-13 08:36:25 582

原创 【MM2020】【lip generation】A Lip Sync Expert Is All You Need for Speech to Lip Generation In The Wild

注:拉到最后有视频版哦~论文地址:https://bhaasha.iiit.ac.in/lipsync这次给大家讲一篇做 lip generation 的文章,发表在 MM 的 2020 上效果如图所示,大致意思就是根据语音生成对应的唇语图片,应用在配音上大致从这五个方面来介绍这篇论文背景背景就是视听消费的兴起增长了快速创建视频的需求动机动机是现在的方法在没见过的场景下缺乏鲁棒性和泛化性目标研究目标是在不需要特定说话者信息的情况下生成真实的同.

2021-04-12 08:52:58 782

原创 【CVPR2020】【语义编辑】StyleRig:Rigging StyleGAN for 3D Control over Portrait Images

注:拉到最后有视频版哦~地址:https://gvv.mpi-inf.mpg.de/projects/StyleRig/这次给大家分享一篇 CVPR2020 的论文,是基于 StyleGAN 结合 3D 信息做人脸编辑的文章我会从这五个方面开始我的介绍背景首先是文章的背景,背景就是 GAN 能够生成很多很真实的图片动机对于文章的动机,就是 GAN 很难控制 3D 的信息,比如旋转角;在 3D 建模中,有 3DMM 这个人脸模型,用这个模型能做 3D 的控制,比如姿态和光照,但是用它渲染出

2021-04-08 13:46:05 803 1

原创 GAN应用

注:拉到最后有视频版哦~我结合我的方向,给大家介绍一下 GAN 方面的一些应用,因为我是做人脸的,大部分的应用都会在人脸上在讲论文前,我们先来回顾下 PGGAN 和 stylegan,我今天讲的三篇论文都是基于这两个网络的PGGAN 是一个渐进式的网络,主要的创新是能产生高清的图片。开始的时候 GAN 的网络非常浅,只能学习低分辨率(4×4)的图片生成,随着训练进行,我们会把 GANs 的网络层数逐渐加深,进而去学习更高分辨率的图片生成,最终不断的更新 GANs,从而能学习到 1024×1024 分辨

2021-04-06 09:39:51 673

原创 GAN小综述

注:拉到最后有视频版哦~GANGAN 的介绍GANs 简单的想法就是用两个模型,一个生成模型,一个判别模型判别模型用于判断一个给定的图片是不是真实的图片,生成模型的任务是去创造一个看起来像真的一样的图片。而在开始的时候这两个模型都是没有经过训练的,这两个模型一起对抗训练,生成模型产生一张图片去欺骗判别模型,然后判别模型去判断这张图片是真是假,最终在这两个模型训练的过程中,两个模型的能力越来越强,最终达到稳态。举个例子,想要成为一名优秀的伪钞制造者,也就是生成器,需要使用原材料,也就是

2021-04-05 12:52:30 660

原创 【CVPR2020】【语音合成】Learning Individual Speaking Styles for Accurate Lip to Speech Synthesis

注意:拉到最后有视频版哦项目地址:https://github.com/Rudrabha/Lip2Wav论文地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Prajwal_Learning_Individual_Speaking_Styles_for_Accurate_Lip_to_Speech_Synthesis_CVPR_2020_paper.pdf文字版这次给大家分享一篇 CVPR2020 的做图片到语音映..

2021-03-26 08:37:43 447

原创 【CVPR2020】【逆推】Image Processing Using Multi-Code GAN Prior

翻到最后有视频版哦~论文地址:https://arxiv.org/pdf/1912.07116.pdf项目地址:https://github.com/genforce/mganprior文字版这次给大家分享一篇,关于GAN逆推的论文,是周博磊老师组在cvpr2020上的一个工作因为现在GAN的生成效果已经非常不错,但是他们的输入都是随机噪声,而我们的需求肯定是对一张已有的图片进行操作,所以GAN逆推这个主题是很关键的,是GAN编辑和生成的基础。GAN的逆推就是生成器的反过程,生成器是

2021-03-10 14:34:25 370 3

原创 【ECCV2020】【逆推】In-Domain GAN Inversion for Real Image Editing

拉到最后有视频版哦~论文地址:https://arxiv.org/pdf/2004.00049.pdf项目地址:https://github.com/genforce/idinvert文字版这次给大家讲一篇关于 GAN 逆推的论文,我先给大家介绍下为什么要做 GAN 的逆推。我之前讲过的,stylegan 能学习到解耦合的特征,基于这个优点,我们可以做图片的很多语义编辑。但是做图片的编辑的前提是我们能拿到图片的隐空间表示,就是 latent code,GAN 的逆推就是做的这..

2021-03-09 19:02:20 1113 2

原创 【arXiv2007】【逆推】Collaborative Learning for Faster StyleGAN Embedding

2021 研究模板 Collaborative Learning for Faster StyleGAN Embedding_20210126 2021-3-7-【arXiv2007】【逆推】Collaborative Learning for Faster StyleGAN Embedding2103DesktopTabletMobile/Wechat文字版这次给大家带来一篇做 GAN 逆推的论文,单位是上海交通大学倪冰冰老师组的我会从这 5 个方面...

2021-03-07 14:05:39 323

原创 【AAAI2020】【风格迁移】FET-GAN Font and Effect Transfer via K-shot Adaptive Instance Normalization

注:拉到最后有视频版哦~论文地址:https://www.aaai.org/Papers/AAAI/2020GB/AAAI-LiW.3470.pdfGitHub 地址:https://liweileev.github.io/FET-GAN/文字版本次给大家讲一篇做字体风格迁移的论文。是 AAAI20 浙大的工作。我会从这 5 个方面开始我的介绍背景首先是背景,字体的风格让网站看起来很好看,字体风格的迁移能让我们复制一些好看的风格动机第二个是动机,在迁移风格的情况

2021-03-06 10:50:03 646 2

原创 【ICCV2019】【模式崩溃】Seeing What a GAN Cannot Generate论文分享

注:拉到最后有视频版~论文链接:https://arxiv.org/abs/1910.11626v1文字版今天我给大家讲两篇论文,一篇是关于 GAN 的模式崩溃可视化的,一篇是关于如何用用 pix2pix 做人脸编辑的先来看第一篇论文,这是 iccv2019 的论文,作者是 MIT 和港中文的我会从以下三个方面来进行本次的讲述背景首先是背景,我先简单解释下什么叫模式崩溃,简单来说就是比如我训练集有猫和狗,理论上来说 GAN 会学到猫特征和狗特征,然后生成时候就会生成...

2021-03-05 11:13:32 534

原创 【ECCV2020】【语义编辑】StyleGAN2 Distillation for Feed-forward Image Manipulation

注:拉到最后有视频版本哦论文链接:https://arxiv.org/abs/2003.03581文字版这篇论文是用 stylegan 的一个曲线救国编辑算法我也还是从这三个方面开始我的讲解背景和动机首先是背景,背景就是基于现在最强的 gan,stylegan 的解耦合特性,可以做图像的编辑然后是文章的动机,对于编辑一张真实的图片,我们需要把他嵌入到 gan 的隐空间中,也就是我上一篇论文说的逆推,这个过程非常慢研究方法研究目标是用 pair 的方式搞一个 i

2021-03-04 10:35:32 520 1

原创 【CVPR2021】【语义编辑】SeFa(Closed-Form Factorization of Latent Semantics in GANs)论文分析

注:拉到最后有视频版本哦文字版我分享一篇用无监督做语义编辑的论文,这篇文章应该是投了 nips,他官网没有更新应该是没有中我还是从这四个方面来介绍背景和动机第一是背景,背景就是 GAN 中有很多语义属性等待我们去发掘然后是动机,首先我们回顾下上次讲的 interfacegan,这篇文章是基于一个假设,就是在 GAN 的隐空间中,pair 的属性可以通过一个超平面去分开。但是这种做法有一定的问题,就是他处理的属性都必须先由一个标准去定义,比如年龄,随便找个网络都能回归,微笑

2021-03-03 21:24:26 1319 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除