机器视觉:对图像和视频用算法进行模式识别和数据挖掘。
图像挖掘的一般过程如下,运用图像处理技术,如图像分割、边缘探测、边缘提取、模式识别等,从图像视频帧)中抽取能代表、区分该图像的结构化内容的特征,同时收集用于图像处理和数据挖掘所需要的知识,获得各种元数据及领域知识,建立特征库和知识库。
深度学习的图像分割技术主要分为两类:
语义分割(semantic segmentation)及实例分割(instance segmentation)
语义分割:会为图像中的每个像素分配一个类别,但是同一类别之间的对象不会区分。
实例分割:其实就是目标检测和语义分割的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体(猫1,猫2,猫3…)(图1、图2)
(图1)
(图2)
深度学习的发展
机器视觉应用方向:
汽车导航、动漫特效(风格迁移)、视频理解自动剪辑(利用前面的帧和后面的帧,识别下图中的高亮镜头,下图)、人脸识别(识别表情甚至是眼睛的位置)
下图为有名的几大主流框架,张老师建议只学pytorch即可,目前最受开发者喜欢的框架
OpenMMLab是基于pytorch的各种算法的一个集合,包含了各种检测。