图像分类学习笔记
分享下学习笔记
图片网上找的勿喷quq
2020 西瓜大 视觉课 学渣笔记 20***406 - cyx
同节课的兄弟仅供参考不要抄了交上去啊
一、图像分类
图像分类是计算机视觉中最基础的一个任务,从比较简单的10分类的灰度图像手写数字识别mnist,到之后的10分类cifar10,图像分类的目标是将不同的图像划分到不同的类别的同时实现最小的分类误差。具体的来说输入为RGB图像的分类任务中,图像被计算机理解为一个M * N* 3(M N由图像像素长宽决定)的矩阵或”张量”,此时图像分类的任务就是通过训练的到一个具体的函数关系能够正确的将图像矩阵映射到对应的具体类别。
如下图为CNN图像分类:
图像分类的传统方法如KNN,SVM在面对比较简单的数据集如MNIST手写数字数据集时有不错表现,但在面对当下下的图像分类的新挑战中往往无法行之有效。图像分类面临着如,视角变化,光照条件,形状,大小变化,遮挡,背景干扰,类内差异的诸多挑战,面对以上所有变化及其组合,好的图像分类模型能够在维持分类结论稳定的同时,保持对类间差异足够敏感。而CNN卷积神经网络能够很好的适应图像分类问题的新挑战。
CNN本质上是一个多层感知机,其成功的原因关键在于它所采用的局部连接和共享权值的方式,一方面减少了的权值的数量使得网络易于优化,另一方面降低了过拟合的风险。CNN是神经网络中的一种,它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。在二维图像处理上有众多优势,如网络能自行抽取图像特征包括颜色、纹理、形状及图像的拓扑结构;在处理二维图像问题上,特别是识别位移、缩放及其它形式扭曲不变性的应用上具有良好的鲁棒性和运算效率等。
二、CNN网络部分简介
(一)CNN
卷积神经网络由具有可学习的权重和偏置常量(biases)的神经元组成。CNN 复合多个卷积层和采样层对输入信号进行加工,然后在连接层实现与输出目标之间的映射。