十、图像处理中的深度学习—图像分类
1.图像处理中的深度学习
机器学习的主要目标泛化,在训练数据集训练算法,并使得这个算法在不可见的数据集上具有高性能;深度学习的优点是尝试以增量方式训练图像。
(1)经典学习与深度学习
①手工特征提取与自动特征提取
②部分与端到端解决方案
③训练时间和高级硬件
④适应性和可迁移性
2.卷积神经网络
架构:一个或多个卷积层—非线性ReLU激活层和池化层—全连接层—多分类器层
(1)卷积层Convolution
由一系列卷积滤波器构成,利用卷积滤波器对输入图像进行卷积,生成特征图。
步幅stride:卷积滤波器每一步的移动量(默认为1)
填充padding:围绕输入的0层(通常用来保持输入和输出图像的大小相同)
★输入nn图像——卷积ff滤波器,填充p,步长s——输出[(n+2p-f)/s+1]×[(n+2p-f)/s+1]图像
(2)池化层Pooling
通过池化降低维数并减少需要学习的参数数量,以缩短训练时间,减少训练所需的数据,克服过拟合;对每张特征图进行下采样,减小高度和宽度,但深度保持不变。
(3)非线性——ReLU层
卷积运算的结果通过非线性激活函数传递
(4)全连接层FC
卷积层和池化层的输出是三维结构体,FC期望的是一维的数字向量,最后池化层的输出需要扁平化(flatten)为一个向量,变为FC层的输入。
(5)随机失活Dropout
针对深度神经网络的正则化技术,用于防止过拟合;在训练中,每次迭代,都有神经元暂时失活或以一定概率p被禁用,p为失活率(默认p=0.5)
3.Tensorflow或Keras进行图像分类
手写数字识别:https://download.csdn.net/download/qq_45190745/87065439
4.应用于图像分类的主流的深度卷积神经网络
VGG16/19: https://blog.csdn.net/qq_19329785/article/details/84504722
AlexNet: https://blog.csdn.net/hgnuxc_1993/article/details/115840197
ResNet: https://blog.csdn.net/m0_54487331/article/details/112758795
InceptionNet: https://zhuanlan.zhihu.com/p/45189981