阅读桑迪潘·戴伊的《Python图像处理实战》笔记十

十、图像处理中的深度学习—图像分类

1.图像处理中的深度学习

机器学习的主要目标泛化,在训练数据集训练算法,并使得这个算法在不可见的数据集上具有高性能;深度学习的优点是尝试以增量方式训练图像。
(1)经典学习与深度学习

①手工特征提取与自动特征提取
②部分与端到端解决方案
③训练时间和高级硬件
④适应性和可迁移性

2.卷积神经网络

架构:一个或多个卷积层—非线性ReLU激活层和池化层—全连接层—多分类器层

(1)卷积层Convolution

由一系列卷积滤波器构成,利用卷积滤波器对输入图像进行卷积,生成特征图。
步幅stride:卷积滤波器每一步的移动量(默认为1)
填充padding:围绕输入的0层(通常用来保持输入和输出图像的大小相同)

★输入nn图像——卷积ff滤波器,填充p,步长s——输出[(n+2p-f)/s+1]×[(n+2p-f)/s+1]图像

(2)池化层Pooling

通过池化降低维数并减少需要学习的参数数量,以缩短训练时间,减少训练所需的数据,克服过拟合;对每张特征图进行下采样,减小高度和宽度,但深度保持不变。

(3)非线性——ReLU层

卷积运算的结果通过非线性激活函数传递

(4)全连接层FC

卷积层和池化层的输出是三维结构体,FC期望的是一维的数字向量,最后池化层的输出需要扁平化(flatten)为一个向量,变为FC层的输入。

(5)随机失活Dropout

针对深度神经网络的正则化技术,用于防止过拟合;在训练中,每次迭代,都有神经元暂时失活或以一定概率p被禁用,p为失活率(默认p=0.5)

3.Tensorflow或Keras进行图像分类

手写数字识别:https://download.csdn.net/download/qq_45190745/87065439

4.应用于图像分类的主流的深度卷积神经网络

VGG16/19: https://blog.csdn.net/qq_19329785/article/details/84504722
AlexNet: https://blog.csdn.net/hgnuxc_1993/article/details/115840197
ResNet: https://blog.csdn.net/m0_54487331/article/details/112758795
InceptionNet: https://zhuanlan.zhihu.com/p/45189981

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值