点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
整理:3D视觉工坊 | 来源:知乎
https://www.zhihu.com/question/330153893/answer/1293995463
本文仅作为学术分享,如果有侵权,会删文处理
2020年,计算机视觉领域会有哪些新的研究方向值得提前探索?
作者:罗浩.ZJU
https://www.zhihu.com/question/330153893/answer/721238966
作者:育心https://www.zhihu.com/question/330153893/answer/740254474
结合计算机视觉、机器人领域5大顶会(CVPR/ICCV/IROS/ICRA/ECCV),以及产业界的需求,总结3个当下热门及前沿的研究领域。
三维视觉
三维视觉是传统的研究领域,但最近5年内得到快速发展。三维视觉主要研究内容有:三维感知(点云获取及处理)、位姿估计(视觉SLAM)、三维重建(大规模场景的三维重建、动态三维重建)、三维理解(三维物体的识别、检测及分割等)。
图 1 3D 视觉的应用场景
3D视觉在CV顶会上的论文比例,也在逐年增加。
图 2 3D视觉在3大视觉顶会的论文比例
视频理解
随着新型网络媒体的出现,以及5G时代的到来,视频呈现爆炸式增长,已成为移动互联网最主要的内容形式。面对于海量的视频信息,仅靠人工处理是无法完成的,因此实现视频的智能化理解则成为了亟待解决的问题。
自2012年,深度学习在图像理解的问题上取得了较大的突破,但视觉理解比图像的目标检测识别要复杂的多。这是因为视频常有许多动作,动作往往是一个复杂概念的集合,可以是简单的行为,但也可能是带有复杂的情绪、意图。举个简单的例子,对一段视频分类,与对一幅图像分类,哪个更容易一些?
从最近几年知名的计算机视觉竞赛,也可以看出,图像层面的竞赛在减少,视频层面的竞赛在增加。
多模态融合
多模态融合的知识获取是指从文本、图片、视频、音频等不同模态数据中交叉融合获取知识的过程。
随着计算机视觉越来越成熟之后,有一些计算机视觉解决不了的问题慢慢就会更多地依赖于多个传感器之间的相互保护和融合。
小结
怕什么真理无穷,进一寸有一寸的欢喜!
作者:oneTaken
https://www.zhihu.com/question/330153893/answer/730187742
个人感觉视觉和语言的联合还是很有前途的,虽然说目前坑比较多,但是万一那一天有了突破就是飞速的发展。
他还举了个例子,一团烟雾的行为可以用公式描述,但是一颗树的生长行为是由温度、光照、水、气候等等许多复杂的因素在很长时间内连续变化所影响的,那么它就是没办法简单地解释的。
举的这个例子并不恰当,反而恰恰说明了神经网络模型解释性的迫切性。一棵树生长的影响因素虽然说是有很多,但是至少我们明确知道控制变量条件下,恰当的温度、恰当的水分等条件可以明确引导树向生长较好的方向生长。
然后对于一个神经网络模型而言,无论是哪个任务,我们都很难说控制只控制某一种因素就可以往预期的方向发展。
推荐阅读:
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题