顶级论文创新点怎么找?中国高校首次获CVPR最佳学生论文奖有感

几天前,同济大学公布了一条重磅消息:本校学生陈涵晟获得CVPR2022最佳学生论文奖,这也是CVPR自2001年设立最佳学生论文奖以来,获奖论文的第一作者首次来自中国高校。

图片

华人在CV领域崛起

最近几年CV领域的顶会,华人作者与日俱增。以CVPR 2022为例,投稿数最多的是来自中国大陆的作者,占到了44.59%;美国则以20.65%的比例位列第二,还不到第一名的一半。虽然我们业内人士已经习惯了华人在顶会上的一路飙升,但是看到最佳学生论文这样重磅级的奖项被中国大陆学生斩获,还是非常震撼的!

这篇佳作是干啥的?

我看了下作者的论文题目:EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation。顿时感觉熟悉而陌生,佩服中带着点惊呆,PnP这么传统的算法竟然还有人一直在默默研究和改进,而且做出了突破性的工作,被世界范围内同行认可。于是,饶有兴致的下载了该论文,想看看能不能学到点什么。

这篇获奖论文主要研究的是针对单目图像中的物体6自由度位姿估计问题,提出的EPro-PnP是一种端到端的概率PnP算法,它将传统多视图几何和深度学习网络结合,实现了在单幅RGB图像上进行精确的位姿估计,该方法在姿态估计和三维物体检测公开数据集上取得的极佳效果。可广泛应用于机器人和自动驾驶领域。作者还开源了代码:

https://github.com/tjiiv-cprg/EPro-PnP

图片

该方法是一种通用的端到端2D-3D对应解决方案,这个“通用”非常重要,模型的泛化性有多么重要,懂的人都懂。

关于创新点的启发

在我们SLAM知识星球交流社区,小伙伴们最焦虑的事情之一就是论文创新点。我之前做了一期关于论文创新点的直播 :今晚19点直播 | 做研究如何寻找创新点? 核心观点如下,还举了一个例子带着大家去找创新点,感兴趣的可以去星球看回放视频。

1、阅读大领域所有综述论文:survey/review + 关键词
2、根据已有积累和兴趣选择细分方向
3、阅读细分方向最近3-5年的综述论文、中文学位论文、英文顶会论文
4、重视带开源代码的论文、编译运行;特别好的论文尽量复现
5、自己采集数据、硬件移植、测试;如有能力,参考前人经验自己写一个框架
6、在实际工程中发现问题。查文献看看别人是怎么解决的;思考自己如何解决
7、干起来!

看了这篇EPro-PnP的论文,我再增加几个观点:

1、重视计算机视觉领域的基础知识。

据我所知,不少其他专业转行到CV方向的一般都直接去研究深度神经网络了,他们可能对各种经典网络如数家珍,最终变成了调包侠、调参侠。

图片

但是却忽略了CV的基础知识的重要性,比如最基础的直方图均衡化、形态学开闭操作、相机成像模型、对极几何、PnP、ICP等。而恰恰有时候,这些基础知识决定了你的上限。

这里需要说明的是,上图中文字是PS的,更讽刺的是,我们用多视图几何里的单应矩阵可以非常简单的实现上面的P图效果。知道怎么做的可以在留言区评论。

2、传统多视图几何 和 深度神经网络(DNN)的结合。

现在DNN方向的研究逐渐从二维转到三维,如果熟悉三维视觉里非常核心的多视图几何知识,绝对能够让你的研究工作如虎添翼。多视图几何方面经过了很多年的研究,具有确定性的理论基础,它可以描述物理世界的结构、形状、体积、深度、姿态、视差、运动、光流等信息,非常有意思,它在三维视觉里必不可少。如果能够将两者结合起来,是非常有希望做出一些突破性的成果的。

图片

以上是我个人的瞎扯淡,如果觉得对你有用,记得点个在看~

独家重磅课程官网:cvlife.net

1、SLAM社区:一个人啃SLAM,难受到自闭,硬顶还是放弃?

2、C++实战:为啥SLAM代码都用C++不用Python?

3、多传感器融合SLAM 激光雷达-视觉-IMU多传感器融合方案!

4、VIO灭霸:VIO天花板ORB-SLAM3第2期上线!(单/双目/RGBD+鱼眼+IMU+多地图+闭环)

5、视觉SLAM基础:刚看完《视觉SLAM十四讲》,下一步该硬扛哪个SLAM框架 ?

6、机器人导航运动规划: 机器人核心技术运动规划:让机器人想去哪就去哪!

7、详解Cartographer:谷歌开源的激光SLAM算法Cartographer为什么这么牛X?

8、深度学习三维重建 总共60讲全部上线!详解深度学习三维重建网络

9、三维视觉基础 详解视觉深度估计算法(单/双目/RGB-D+特征匹配+极线矫正+代码实战)

10、 VINS:Mono+Fusion SLAM面试官:看你简历上写精通VINS,麻烦现场手推一下预积分!

11、图像三维重建课程:视觉几何三维重建教程(第2期):稠密重建,曲面重建,点云融合,纹理贴图

12、系统全面的相机标定课程:单目/鱼眼/双目/阵列 相机标定:原理与实战

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值