浅谈CVPR2022的几个研究热点

CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,我将跟大家聊聊CVPR的一些研究热点,希望对那些计划投下一轮CVPR的同学提供一点参考信息。


1. 十大热点研究领域

首先,我们基于oral论文的统计信息,按照接收论文比重以及所述领域进行排序,得到的十个热点领域,包括:多角度三维视觉,图像与视频合成,识别检测分类与检索,深度网络结构设计,视觉与语言处理交叉,低质量数据视觉分析,形状分析,迁移学习,视频分析与理解,姿态估计。

1036bbf0426d4826a52aca4395e002d6.png

图1. 十大研究热点领域(Oral)

当我们统计全部接收论文时,统计数据在顺序上会有一点变化,包括:识别检测分类与检索,图像与视频合成,多角度三维视觉,低质量数据视觉分析,视觉与语言处理交叉,形状分析,迁移学习,深度网络结构设计,自监督与非监督学习,视频分析与理解。

ce8491382f574f8e81fa8c34917c1369.png

图2. 十大研究热点领域(All)

可以看到,两个排序对应的研究热点问题,具有极高的重复性。结合两个表,偏重于应用层面的角度对热点进行总结,我从中选出五个热点研究方向,供计划投稿的同学参考:

  • 多角度三维视觉
  • 图像与视频合成
  • 识别检测分类与检索
  • 视觉与语言处理交叉
  • 低质量数据视觉分析

2. Best Paper

CVPR2022的Best paper list包含四篇文章,分别为:

Best Paper Award: Learning to Solve Hard Minimal Problems

Best Paper Honorable Mention: Dual-Shutter Optical Vibration Sensing

Best Student Paper Award: EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation

Best Student Paper Honorable Mention: Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields

最佳论文为《Learning to Solve Hard Minimal Problems》。粗看了下,不是很懂,大概是在对优化问题领域做了一些偏理论性的工作,引入了几何优化的一些工具。《Dual-Shutter Optical Vibration Sensing》是关于三维激光扫描的技术。《EPro-PnP: Generalized End-to-End Probabilistic Perspective...》基于多点透视理论,提出一种从图像中估计物体的三维姿态的方法。《Ref-NeRF》基本就是NeRF算法的变种研究。从最佳论文的侧重可以知道,CVPR比较青睐三维视觉相关研究。另外,会前呼声较高的Kaiming老师的《Masked Autoencoders Are Scalable Vision Learners》也是值得深入学习的。基于MAE提出一种基于patch预测的编解码结构,对于数据图像内容理解具有极好的预测与重建性能。该论文被列为最佳论文候选。


3. 个人关注

因为我个人最近一直在做颜色迁移,光照优化一类的工作,所以比较关注low-level vision领域。今年CVPR在该领域录取了19篇oral以及91篇poster,接收文章数不能算少。我将对应的19篇oral文章抄写在这里,方便之后学习。

[1] Robust Equivariant Imaging: A Fully Unsupervised Framework for Learning To Image From Noisy and Partial Measurements. (去噪+超分辨率用于图像增强技术)

[2] Bijective Mapping Network for Shadow Removal. (消除影子)

[3] Event-Aided Direct Sparse Odometry. (稀疏点云加强)

[4] MAXIM: Multi-Axis MLP for Image Processing.(通用图像质量增强算法)

[5] Details or Artifacts: A Locally Discriminative Learning Approach to Realistic Image Super-Resolution.(超分辨率)

[6] Dual Adversarial Adaptation for Cross-Device Real-World Image Super-Resolution. (超分辨率)

[7] ELIC: Efficient Learned Image Compression With Unevenly Grouped Space-Channel Contextual Adaptive Coding. 

[8] Discrete Cosine Transform Network for Guided Depth Map Super-Resolution. (超分辨率)

[9] Deep Rectangling for Image Stitching: A Learning Baseline.(图像拼接)

[10] CamLiFlow: Bidirectional Camera-LiDAR Fusion for Joint Optical Flow and Scene Flow Estimation. (光流优化)

[11] Toward Fast, Flexible, and Robust Low-Light Image Enhancement. (低光增强)

[12] Faithful Extreme Rescaling via Generative Prior Reciprocated Invertible Represe-ntations.

[13] Learning Trajectory-Aware Transformer for Video Super-Resolution. (超分辨率)

[14] SphereSR: 360deg Image Super-Resolution With Arbitrary Projection via Continuous Spherical Image Representation.(超分辨率)

[15] Parametric Scattering Networks. (优化的学习结构)

[16] Target-Aware Dual Adversarial Learning and a Multi-Scenario Multi-Modality Benchmark To Fuse Infrared and Visible for Object Detection. (低光环境下的对象探测)

[17] Learning to Deblur Using Light Field Generated and Real Defocus Images. (去模糊)

[18] Burst Image Restoration and Enhancement. (图像重建)

[19 ]Restormer: Efficient Transformer for High-Resolution Image Restoration. (去模糊)

在low-level vision领域,超分辨率仍然占有较大的比重。一些工作包括去模糊,质量增强,细节重建等,本质上还是和超分辨率技术有紧密的联系。看来,未来做low-level vision,大概率要利用到超分辨率算法。从部分论文可以看出,三维视觉已经结合到low-level vision领域。针对深度图,全景照片等具有三维属性的数据,进行细节重建,运动补偿等计算,也是很不错的研究方向。

 

CVPR 2022是计算机视觉和模式识别领域的顶级会议,而多模态研究是其重要的研究方向之一。多模态处理涉及处理和融合来自不同感知模态(例如图像、语音、文本等)的信息,以提高对现实场景的理解能力。 在CVPR 2022多模态方向的研究中,一些关键的趋势和话题将得到关注。首先,基于深度学习的多模态方法将继续发展,因为其在处理多模态数据中的高级特征表示方面取得了显著成果。这些方法使用强大的神经网络架构,能够跨不同感知模态获取数据并实现融合。此外,对于多模态研究的探索还将进一步推动更加复杂和深层次的网络设计,以实现更好的融合效果。 其次,跨模态学习也是CVPR 2022多模态研究的重要方向之一。这项研究旨在利用不同模态之间的共享知识,通过迁移学习和领域自适应等技术,从一个模态中的标记数据中学习到其他未标记模态的有效表达。这对于那些有限标记数据的模态研究任务非常有价值。 最后,CVPR 2022多模态方向还将关注各种真实应用场景中的挑战和问题。例如,多模态医学图像处理和分析领域的研究,可以辅助医生进行更准确的诊断和疾病检测。另外,多模态文本和图像生成方面的研究,也能够推动现实世界中的创造性设计和内容生成。 总之,CVPR 2022多模态方向的研究将继续推动计算机视觉和模式识别领域的发展。通过深度学习、跨模态学习以及应用于不同领域的研究,我们可以期待在多模态数据处理和融合方面取得更多突破和创新。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序猿老甘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值