【0514 更新中】CVPR2019 论文解读汇总

CVPR2019 论文解读汇总（0514 更新中）

原文 http://bbs.cvmart.net/topics/287/cvpr2019

计算机视觉顶会CVPR 2019 接收结果已经出来啦，相关报道：1300篇！CVPR2019接收结果公布，你中了吗？。目前官方只公布了接收论文ID列表，极市已汇总目前公开的所有论文链接及code，详情请关注：

CVPR 2019 论文汇总（按方向划分，GitHub更新中）

以往极市曾开设了CVPR2018论文解读、ECCV2018论文解读等顶会论文解读汇总贴，详情请关注：顶会文章的解读汇总（CVPR/ECCV/ICCV/NIPS）本次CVPR2019 接收结果公布后，也出现了许多优秀的论文解读，为方便大家阅读，极市特开设此帖希望可以实时跟进和汇总CVPR2019 的优秀论文解读文章，以下是解读文章，欢迎收藏阅读~

ps.极市正计划做CVPR2019的专题直播分享会，邀请CVPR2019作者直播分享技术干货，目前已完成3期直播：
CVPR2019 专题直播 | 王鑫龙：联合分割点云中的实例和语义
 极市直播 | CMU 诸宸辰:基于 Anchor-free 特征选择模块的单阶目标检测 (CVPR2019)
CVPR2019 专题直播 | 张志鹏:基于 siamese 网络的单目标跟踪

48、10 分钟看完：悉尼科技大学入选 CVPR 2019 的 8 篇论文，都研究什么？
本文介绍了悉尼科技大学杨易教授组8 篇CVPR2019论文（3 篇Oral），包括行人重识别/生成，迁移学习，网络结构搜索，图像生成，网络压缩等领域的工作。

47、CVPR2019 Oral | Relation-Shape CNN：以几何关系卷积推理点云 3D 形状
来自中科院自动化所模式识别国家重点实验室的研究者提出了Relation-Shape CNN，将经典的2D CNN拓展至3D点云领域进行几何关系学习，该方法在三个主流的点云分析任务上均实现了优秀的性能。

46、CVPR2019 | 不同视角构造cycle-consistency，降低视频标注成本
本文介绍的两篇文章从不同视角来构造cycle-consistency约束，目标都是为了在不需要标注label情况下，学到更好的视频representation，这也是解决在real-world中大规模无标注视频数据的低利用率及高昂的frame-level人工标注成本等问题。

45、CVPR2019 | 旷视实时语义分割技术DFANet：高清虚化无需双摄
论文提出一种实时语义分割技术——DFANet，不仅减小了 7 倍计算量，突破实时计算边界，而且无需双摄也可实现手机图像的高清虚化。

44、CVPR2019 | OCGAN: 使用具有约束潜在表示的GAN的一类新颖性检测
论文主要探究一类新奇检测的问题，类似异常检测，解决方法是利用去噪的编码-解码网络去学习特定类的Latent表示。

43、CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法
华中科技大学刚刚开源的一款人体姿态迁移算法，其基于GAN思想构建，效果好到简直令人不可思议，论文为CVPR 2019 Oral。

42、CVPR2019 | （Oral）视频跟踪新思路，完全无需手工标注
提供了一种新的训练视频跟踪的思路。这个工作的目标就是训练一个神经网络，使得它能帮助我们获得在video中帧与帧之间的semi-dense correspondence。

41、如何看待 CVPR2019 论文 Libra R-CNN（一个全面平衡的目标检测器）？
本文是CVPR2019 论文 Libra R-CNN作者对整体paper的解析，论文即将开源～

40、CVPR 2019 | 图像压缩重建也能抵御对抗样本，这是一种新的防守策略
在这篇文章中，我们将介绍一篇关于对抗样本的论文，该论文表示我们可以重构对抗样本而去除掉对抗信息，从而令它不会对分类模型产生危害。

39、CVPR2019 | 行人检测新思路：高级语义特征检测取得精度新突破
本文作者将行人检测问题转化为高级语义特征检测的问题，刷新了行人检测精度的新高度！而且作者称代码将开源。

38、CVPR2019 | 人脸聚类——Linkage Based Face Clustering via GCN
本次介绍的工作主要就是为了解决“如何确定距离”这个问题，这是CVPR 2019的一个文章“Linkage Based Face Clustering via Graph Convolution Network”，就是通过利用GCN来识别graph的linkage关系的。

37、SKNet——SENet孪生兄弟篇（CVPR2019）
启发自皮质神经元根据不同的刺激可动态调节其自身的receptive field，是结合了SE operator，Merge-and-Run Mappings，以及 attention on inception block 思想的产物，实测目前在超分辨的任务上有明确的提升，扩展应用前景还是值得期待的~

36、CVPR2019语义分割论文：Structured Knowledge Distillation for Semantic Seg
这是一篇CVPR2019做语义分割任务的文章，在训练好的大的分割模型上运用知识蒸馏的算法，使得比较小的模型也能提高语义分割的性能。

35、CMU和旷视科技开源：KL-Loss目标检测边界框回归新算法（CVPR2019）
作者提出一个全新的 regression loss，结合kl散度，使得网络可以更好的学习拟合ground truth，让网络更好的学习和收敛(而不被模糊样例造成的大loss干扰)。

34、CVPR2019 | 旷视提出Meta-SR：单一模型实现超分辨率任意缩放因子
旷视的CVPR2019论文，论文提出一种全新方法，称之为 Meta-SR，首次通过单一模型解决了超分辨率的任意缩放因子问题（包括非整数因子）

33、CVPR2019 |「准满分」论文：英伟达推出首个跨摄像头汽车跟踪数据集
这篇论文主要介绍了英伟达新推出的 CityFlow（流动之城）数据集，是目前世界上第一个支持跨摄像头汽车跟踪及再识别的大型数据集，同时拥有最多的摄像头数量（40）以及最大的空间跨度（> 3 km^2），为智慧城市的解决方案提供了最好的测试平台。

32、CVPR 2019 | 旷视等Oral论文提出GeoNet：基于测地距离的点云分析深度网络
基于网格曲面的几何拓扑信息可以为物体语义分析和几何建模提供较强的线索，但是，如此重要的连接性信息在点云中是缺失的。为此，旷视西雅图研究院首次提出一种全新的深度学习网络，称之为 GeoNet，可建模点云所潜在表征的网格曲面特征。

31、CVPR 2019 Oral | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器
作者从优化的角度出发，通过实验解释了梯度稳定手段之一的 BatchNorm 是如何帮助随机初始化训练一阶段检测器 SSD，进而结合了 ResNet 与 VGGNet 来加强对小物体的检测。

30、CVPR2019 | R-MVSNet: 一个高精度高效率的三维重建网络
MVSNet升级版——“R-MVSNet”，该网络在原MVSNet的基础上进行改进，引入循环神经网络架构，可依序地在深度方向通过GRU单元正则化2D的代价图，较大程度地缓解了内存消耗。

29、CVPR2019目标检测方法进展综述
本文首先综述近年来二维目标检测的优化方向，之后介绍CVPR2019目标检测最新进展，包括优化IoU的GIoU，优化anchor设计的GA-RPN，以及single-stage detection的FSAF。

28、CVPR2019无人驾驶相关论文
CVPR2019无人驾驶相关论文的汇总，包括3D目标检测、立体匹配、单目视觉测距等，更新中。

27、CVPR2019 | Decoders 对于语义分割的重要性
该文章提出了一种不同于双线性插值的上采样方法，能够更好的建立每个像素之间预测的相关性。得益于这个强大的上采样方法，模型能够减少对特征图分辨率的依赖，能极大的减少运算量。

26、CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度
对于深度卷积神经网络而言，准确度和计算成本往往难以得兼。本文则给出了一个新的思路——使用异构的卷积过滤器；实验表明这种方法能在保证准确度的同时显著降低计算成本。

25、图像分类算法优化技巧：Bag of Tricks for Image Classification
这篇文章是亚马逊科学家介绍CNN网络调优的细节，许多实验是在图像分类算法做的，比如ResNet，作者不仅复现出原论文的结果，在许多网络结构上甚至超出原论文的效果，而且对于目标检测、图像分割算法同样有提升作用。目前论文已被CVPR2019接收。

24、双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）
本文提出了一个新的自然场景图像分割框架，称为双重注意力网络（DANet），引入了一种自注意力机制来分别捕捉空间维度和通道维度上的视觉特征关联。目前论文已被CVPR2019接收。

23、CVPR 2019| ILC：用于自然场景多目标的计数模型
本文提出用于自然场景的计数模型，基于Image-level的方式训练，相较于以往需要Instance-level/point-level/bounding box level等训练方式来说，此模型只要有出现的类别以及各自的数量即可进行训练。

22、CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度
对于深度卷积神经网络而言，准确度和计算成本往往难以得兼，本文则给出了一个新的思路——使用异构的卷积过滤器；实验表明这种方法能在保证准确度的同时显著降低计算成本。

21、CVPR2019 | 西北工业大学开源拥挤人群数据集生成工具，大幅提升算法精度
来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法，并开源了他们创建的大型数据集，在此数据集上训练的算法精度获得了大幅提升，超越了之前的state-of-the-art。

20、DaSiamRPN的升级版，视觉目标跟踪之SiamRPN++
商汤新工作，DaSiamRPN的升级版：SiamRPN++，在多个跟踪数据集上都是state-of-the-art ，目前论文已被CVPR2019接收（oral）。

19、CVPR 2019 | 让机器帮你做行测题，UCLA朱松纯团队提出关系和类比视觉推理数据集RAVEN
为了突破当前视觉推理能力的极限，UCLA 朱松纯团队基于一项更难的人类视觉推理任务——瑞文测试（RPM，例如《行测》中的图形推理题）构建了关系和类比视觉推理数据集 RAVEN。

18、CVPR 2019 | 微软亚研院提出用于语义分割的结构化知识蒸馏
该文研究了在语义分割模型的知识蒸馏中引入结构化信息的损失函数，在不改变模型计算量的情况下，使用该方法在Cityscapes数据集上mIoU精度取得了最高达15.17%的提升。

17、CVPR 2019 | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器
本文介绍了京东AI研究院被接受的一篇 Oral 论文，作者从优化的角度出发，通过实验解释了梯度稳定手段之一的 BatchNorm 是如何帮助随机初始化训练一阶段检测器 SSD，进而结合了 ResNet 与 VGGNet 来加强对小物体的检测。

16、CVPR2019 | 业内最大规模！美图联合清华推出教程类行为数据集 COIN
美图和清华团队联合发布了业界规模最大、多样性最丰富的教程类行为数据集 COIN。该数据集在标注结构上采用分层的组织结构，涵盖了多种不同类型的教程类视频。给复杂场景下视频动作时序定位等问题的研究提供了丰富的数据资源。

15、CVPR2019 | Stereo R-CNN 3D 目标检测
这是一篇来自DJI与港科大合作的双目的3d object detection文章，解决立体视觉中的检测问题。整个文章将传统的detection的任务，结合了geometry constraint优化的方式，用在3Ddetection上面还是比较新颖的。

14、CVPR2019 oral | 这个面部3D重建模型，造出了6000多个名人的数字面具
本文提出了一种新型的面部三维重建模型，效果惊艳。该模型基于自监督学习，使用了来自 YouTube 抓取的 6000 多个名人的视频片段进行训练，该模型可以完全从零开始学习，将面部的多种特征分离再重新组合。

13、CVPR2019 | 医学影像：MIT 团队提出利用学习图像变换进行数据增强
近日，由麻省理工学院（MIT）电子工程与计算机科学（ECCS）实验室多位博士所著的医学影像AI论文被CVPR 2019收录。该团队为了解决医学图像标注数据缺乏的问题，提出了通过学习图像的变换（transforms）进行数据增强的半监督分割方法。

12、CVPR2019 | SiamMask：视频跟踪最高精度
本文介绍一篇非常优秀的视觉跟踪方面的论文，作者提出的新算法SiamMask，在视频跟踪任务上达到最优性能，并且在视频目标分割上取得了当前最快速度。作者来自中科院自动化所、牛津大学等，本文带来一作自动化所王强的解读。

11、CVPR2019 | FSAF：来自CMU的Single-Shot目标检测算法
本文介绍了来自CMU的CVPR2019论文，提出了一个非常优秀的Single-Shot目标检测算法：FSAF。

10、CVPR2019 | AlphaPose升级！上海交大卢策吾团队开源密集人群姿态估计代码
AlphaPose升级了！上海交大MVIG组(卢策吾团队)构建了CrowdPose数据集，用来衡量算法在拥挤场景中的性能。同时提出了一个高效的算法来解决拥挤人群中的姿态估计问题，实验结果远高于当前最好的算法。

9、CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade
在本篇论文中，作者提出了一种新的实例分割框架，设计了多任务多阶段的混合级联结构，并且融合了一个语义分割的分支来增强 spatial context。取得了明显优于 Mask R-CNN 和 Cascade Mask R-CNN 的结果。

8、CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN
本文分析了过去的经典分割框架存在的缺陷，并提出基于Mask R-CNN提出一个新的框架Mask Scoring R-CNN，能自动学习出mask quality，试图解决不配准的问题。

7、CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr
本文提出了一种针对卷积神经网络的训练方法RePr，非常简单有效，在cifar、ImageNet、VQA、object detection上涨点很多，ablation study做的非常充分。

6、CVPR2019 | 审稿排名第一满分论文：让机器人也能「问路」的视觉语言导航新方法
本文是CVPR满分文章（3个Strong Accept），在5165篇投稿文章中得分排名第一。该论文提出的新方法结合了强化学习和自监督模仿学习两者之长，在视觉-语言导航任务上取得了显著的进步。

5、CVPR2019 | 全景分割：Attention-guided Unified Network
中国科学院自动化研究所所做关于全景分割问题。本文提出了一个叫做 Attention-guided Unified Network ( AUNet ) 的结构去解决全景分割问题，该方法在MS-COCO数据集上取得了目前最好的结果。

4、CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion
李飞飞夫妇等研究者提出了 DenseFusion——一种可单独处理两个数据源的异质架构。目前这项工作已被CVPR2019接收。

3、CVPR2019 | 目标检测新文：Generalized Intersection over Union
本文提出用IoU这个直接的指标来指导回归任务的学习，用直接指标IoU作为损失函数的缺陷性，提出新的metric来代替L1、L2损失函数，从而提升regression效果。

2、CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法
来自微软和中国科技大学研究学者提出了基于深度高分辨表示学习的姿态估计算法，论文和相应代码甫一公布，立刻引起大家的关注，不到一天之内，github上已有将近50颗星。

1、CVPR2019 | Guided Anchoring: 物体检测器也能自己学 Anchor
物体检测领域论文"Region Proposal by Guided Anchoring"解读，这篇 paper 的方法用在了 COCO Challenge 2018 检测任务的冠军方法中，在极高的 baseline 上涨了1个点。论文目前已被CVPR2019接收。