一、计算机视觉分类
a图像分类:用于识别图像中物品类别
b目标检测:用于检测图像中每个物品类别,并准确标出位置
c图像语义分割:用于标出图像中每个像素点所属类别,属于同一个像素点用一个颜色标识
d实例分割:b图像只需要标注物体位置,d中不仅标注物体位置,还要标注物体外形轮廓
二、CNN
1、CNN的优点:
能够有效的将大数据量的图片降为成小数据量,能有效的保留图片特征,符合图片处理原则
2、CNN了解:
卷积神经网络(convolutional neural network,CNN),是一种专门用来处理具有类似网络结构的数据的神经网络。
3、五层网络结构:
数据输入层/input layer
预处理,把图像转变成像素矩阵
卷积层/CONV layer(提取图像中的局部特征)
卷积计算:
填充值zero-padding:
防止边角数值被使用次数过低、边界填充0值,避免边缘数据丢失或利用不充分
步幅(stride)减少输入参数的数目,减少计算量:
ReLU激励层/ReLU layer
激活函数:
池化层/Pooling layer(降低参数量级)
全连接层/FC layer
把前面所有的值进行分析,得到最后结果