一、计算机视觉分类
图像分类
用于识别图像中物体的类别
目标检测
用于检测图像中的每个物体的类别,并准确标出它们的位置
图像语义分割
用于标出图像中每个像素点所属的类别,属于同一类的像素点用一个颜色标识
实例分割
不仅标出物体位置,还需要标注出物体的外形轮廓
二、CNN解决问题
能够有效将大数据量的图片降维成小数据量,同时可以有效保留图片特征,CNN是一种专门用来处理具有类似网格结构的数据的神经网络。
三、CNN五层网络结构
数据输入层
预处理,图片的像素矩阵
卷积层(提取图像中的局部特征)
对输入图像和滤波矩阵(恒定的滤波器
filter
)做
内积
(逐个元素相乘再求和)
卷积计算
填充值(为了每个数据被使用到的次数相同,边缘数据丢失)
步幅(减少输入参数的数目,减少计算量)
激活层
激活函数(存在非线性元素)
提高抗干扰能力,非线性表达能力,缓解梯度消失问题,加速模型收敛,将当前特征空间映射转换到另一个空间,从而让数据更好地被分类
ReLU激活函数
池化层
使特征图变小,简化网络计算复杂度,加快计算速度。
特征压缩,提取主要特征。
防止过拟合。
缩小最后全连接层中节点的个数,减少整个神经网络参数。