如何评价CVPR 2022的best paper?

链接:https://www.zhihu.com/question/538874119/answer/2541126096

编辑:深度学习与计算机视觉

声明:仅做学术分享,侵删

作者:匿名用户
https://www.zhihu.com/question/538874119/answer/2540738329

配不配best paper这点不是在下这种匿名菜鸡能评价的,只是说一点在下知道的。

仅从cv的角度来看,这类组合优化背景的geometric fitting的问题还是挺有应用背景的(以在下粗鄙的理解就是给一个目标的参数方程形式,但有多少个目标咱不知道,这类问题在cv里除了论文里面的ransac,还有一大类就是类别数目未定的图像分割,很多欧洲老哥把这类问题叫stochastic geometry models,九十年代就有书在说这东西)。

在深度学习之前,cv里搞这块的挺多的,就在下仰慕的华人大佬list里面,和这块有关的比如华人大佬马毅老师07 pami的那篇分割的paper(拿coding length来度量搜索过程),还有就是mm lab大佬lin dahua老师在mit读博的john fisher那个实验室(拿nonparametric bayesian演化搜索过程的),硬扯关系的话还能扯到朱松纯老师老师那个02年的pami(只不过其中用的reversible mcmc和当时同时代的dirichlet process相比操作起来过于tricky),还有很多人直接拿一些几何和拓扑的性质来约束演化或者建模成multi-cut问题的(这些文章一般cv的期刊上现在还会隔三差五出现,pami,ijcv和siims,还有包括被知乎大神黑哭的tip)有些还是用很古老的方法在做一点改进的(顺便贴一个前两年pami上看见的 extracting geometric structures in images with delaunay point process(顺便吐槽这文章是真的a+b))。

毕竟是一般的组合优化问题,只要有了新工具,都可以往上试试看能不能让解在一定条件下更快更好(可能有人说有了隔壁智能优化算法内味了),并且看一下是不是对自己的cv项目有好处,大佬可能还看看能不能一鸡多吃,有一些理论+有一些应用。如果说之前的同类文章是把当时新发展的 optimization \ bayesian statistics \ computational physics这些偏应用计算的数学拿过来搞搞,如果之前的那些文章是有价值的,那这篇把learning用进来搞搞的也有价值。至于够不够best paper,我们也必要和饭圈一样互撕,就像2019年那篇费马路径的best paper,请问大家还有多少关注吗。可能对于咱们一般的科研民工,能让自己研究收益最多的paper才是best paper

作者:匿名用户
https://www.zhihu.com/question/538874119/answer/2540899777

虽然不是很懂这篇论文,但想聊聊顶会best paper挑选的准则。

1.所有子领域,无论火热与否,都应平等对待。科研不是选秀,领域影响力和当前的实用性不能作为评判因素,不能因为现在DL火就只盯着DL的论文选best paper,任何领域在将来都有潜力发光发热,遥想当初,神经网络冷宫也坐了好几十年。若整个CV只允许出现一种声音,那这个领域迟早会死去;鼓励优秀扎实的非主流研究,才能让未来充满无限可能,等待科学研究的下一个爆点。

2. best paper应该肉眼可见地推进了所属子领域的发展,有难以替代的工作量或洞见,解决了某个难啃的骨头。当年的resnet就是一个典型,极其漂亮地解决了深度神经网络训练的问题;再比如19年NIPS的best paper,解决了理论机器学习的一个长期重要难题。今年的MAE,和MoCo一样,是个好工作,但在推进领域发展上,可能评best paper还不太够。

作者:OpenDIC
https://www.zhihu.com/question/538874119/answer/2540585000

大概看了下最佳论文荣誉提名的《Dual-Shutter Optical Vibration Sensing》,原理类似实验力学领域中光测力学的数字图像相关法(Digital image correlation,DIC),感兴趣的朋友可以看看我主页发表的几篇关于DIC原理介绍的文章。该非接触式测量变形的方法已有四十年历史,目前已经有很成熟的商业软件,其算法核心与视觉领域的光流估计、模板匹配以及图像配准都有相通之处。

传统基于DIC测量物体的高速振动需要高速相机采集物体表面的散斑图像,然后计算跟踪同名点的位移,进而可以计算应变等力学性能。

该文章仅依赖全局相机和卷帘相机就可以实现高速振动测量,好像是以全局相机采集的散斑图像作为参考图像,卷帘相机采集的散斑图像作为振动变形图像,然后计算位移,实现振动的测量,对于高速振动测量领域有一定的启发,毕竟高速相机动辄几十万,确实太贵了。

一点不太成熟的小疑惑,这个文章发表在振动测量的顶刊是不是会更合适?

☆ END ☆

如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。

扫描二维码添加小编↓

73a5629de034510a3f56e46703ebd6e7.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CVPR 2022是计算机视觉和模式识别领域的顶级会议,而多模态研究是其重要的研究方向之一。多模态处理涉及处理和融合来自不同感知模态(例如图像、语音、文本等)的信息,以提高对现实场景的理解能力。 在CVPR 2022多模态方向的研究中,一些关键的趋势和话题将得到关注。首先,基于深度学习的多模态方法将继续发展,因为其在处理多模态数据中的高级特征表示方面取得了显著成果。这些方法使用强大的神经网络架构,能够跨不同感知模态获取数据并实现融合。此外,对于多模态研究的探索还将进一步推动更加复杂和深层次的网络设计,以实现更好的融合效果。 其次,跨模态学习也是CVPR 2022多模态研究的重要方向之一。这项研究旨在利用不同模态之间的共享知识,通过迁移学习和领域自适应等技术,从一个模态中的标记数据中学习到其他未标记模态的有效表达。这对于那些有限标记数据的模态研究任务非常有价值。 最后,CVPR 2022多模态方向还将关注各种真实应用场景中的挑战和问题。例如,多模态医学图像处理和分析领域的研究,可以辅助医生进行更准确的诊断和疾病检测。另外,多模态文本和图像生成方面的研究,也能够推动现实世界中的创造性设计和内容生成。 总之,CVPR 2022多模态方向的研究将继续推动计算机视觉和模式识别领域的发展。通过深度学习、跨模态学习以及应用于不同领域的研究,我们可以期待在多模态数据处理和融合方面取得更多突破和创新。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值