计算机视觉(computer vision, 简称CV)伴随着AI的发展越来越被人熟知。在学术界,CVPR,ICCV,TPAMI,IJCV等顶刊顶会受到了越来越多的追棒。在工业界,国内外顶尖的CV企业异军突起极大推动了该领域的产业落地。但作为AI的核心方向,CV下一步在学术界和工业界的发展还存在着非常大的问题,需要我们一批批爱好CV,想要从事CV行业的同志们接力的把CV继续发展下去。很多的同学或者视觉爱好者想更好的了解计算机视觉的一些基础的东西。我自己的话也是跟大家一样非常想系统的了解一下计算机视觉的各个方向的一些基本的东西,方便宏观的了解这个领域以及进行下一步的方向选择。目前网络上有各种大牛的分享或者教授的资料。我自己感觉受益匪浅,同时也感觉到自己接触的很多的资料都比较散一些,可能涉及其中的一部分或者几部分。所以我就萌生了自己整理一份计算机视觉方向的想法。希望能尽量把自己接触学习到的CV领域的一些基本方法和相关的资料尽可能整理出来,方便后续的学习和回顾,同时也希望能给后来人一些微不足道的帮助。
计算机视觉是一门研究教会机器”看”的科学,但如果非要给它下一个明确的定义,却又不知如何给它界定边界。借用自动化所胡占义研究员的定义:计算机视觉的目标是对环境的表达和理解,核心问题是研究如何对输入的图像信息进行组织,对物体和场景进行识别,进而对图像内容给予解释。计算机视觉的发展主要经历了马尔计算机视觉,主动和目的视觉,多视几何和分层三维重建以及目前正火的基于学习的视觉。根据视觉任务的不同,计算机视觉可以主要包括以下方向(各个部分可能相互之间有些重叠):
图像分类识别
目标检测
目标跟踪
图像分割
GAN
图像滤波与降噪
图像增强
图像风格化
图像检索
三维视觉:三维感知,位姿估计(SLAM),三维重建,三维理解
视频理解
多模态融合
在后续的更新中,我将针对其中的各个方向一一整理。由于能力有限,可能其中部分有些错误,请大家批评指正。
参考资料:
https://mp.weixin.qq.com/s/If1GdkPuxHXLU4pr0UDaHA