ICLR 2017
论文标题 | Modulating early visual processing by language |
研究问题 | VQA |
前提假设 |
|
创新点 | 率先将CBN引入到VQA的问题当中,通过MLP对输入的question进行embedding,然后再基于得到的embedding来调控ResNet每个BN层的参数,进而使得模型能在训练前期实现对图像信息的调控 |
ECCV 2016
论文标题 | Perceptual Losses for Real-Time Style Transfer and Super-Resolution |
研究问题 | Style transfer |
前提假设 | high-quality images can be generated by defining and optimizing perceptual loss functions based on high-level features extracted from pre-trained networks. |
创新点 | 将perceptual loss作用在预训练好的VGG网络所提取到的高层语义特征中,确保了模型能在最后生成与content image语义相一致的图片 |
解决方案 | 整个网络结构主要由两个部分构成:
|
不足之处 | 每次训练只能完成一种分割的迁移,不能并行完成多种图片风格的迁移 |
ICLR 2017
论文标题 | A Learned Representation For Artistic Style |
研究问题 | Style transfer |
前提假设 |
|
创新点 | 将CIN引入到了style transfer中,通过style image对应的IN层参数来替换content image对应的IN参数 |
不足之处 | 无法进行任意风格的图像迁移 |
ICCV 2017
论文标题 | Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization |
研究问题 | Style transfer |
前提假设 |
|
创新点 | 将AdaINy引入到了style transfer任务中。AdaIN层不存在需要学习的参数,每个affine parameters都从输入的style image中计算得到,从而实现了任意风格的图片转换 |
解决方案 |
|
AAAI 2020
论文标题 | Dynamic Instance Normalization for Arbitrary Style Transfer |
研究问题 | Style Transfer |
前提假设 | 文章主要基于AdaIN的两个缺点提出
|
创新点 | 设计了一个动态的卷积算子来自适应地学习IN层的参数 |
解决方案 |
|
NurIPS 2019
论文标题 | Positional Normalization |
研究问题 | Style Transfer |
前提假设 | 基于feature map的每个位置来进行通道归一化。采用这种方式所得到的一阶统计量和二阶统计量在一定程度上能够捕获图片的空间结构信息 |
创新点 |
|
CVPR 2019
论文标题 | Semantic Image Synthesis with Spatially-Adaptive Normalization |
研究问题 | Semantic Image Synthesis |
前提假设 | 在语义图像合成的任务中,采用instance normalization会丢失掉segmentaion mask的语义信息,而空间自适应归一化的方法则能够很好地保留segmentation mask的语义信息 |
创新点 | 提出了空间自适应归一化方法,能够在Image Synthesis task中很好地保留输入图像的语义信息 |
ICLR 2018
论文标题 | cGANs with Projection Discriminator |
研究问题 | GAN |
前提假设 | |
创新点 | |
解决方案 | |
不足之处 |