1.深度学习基础
特征工程:尽可能选择和构建出好的特征,使得机器学习算法能够达到最佳性能。
深度神经网络:有多层隐含层的神经网络。
深度学习:自动的从数据中学习与任务相关的特征;提取出的特征缺乏可解释性。
端到端学习:自动从数据中学习特征
(端到端思想就是输入原始特征,输出预测结果,
不需要像传统机器学习算法那样进行一系列的特征提取)
数据驱动:当某个任务的数据量大到一定程度,机器就可能在该任务上超过人类。
深度学习三要素:数据、算法、计算力
- 数据量越大,深度学习的优势越明显
- 大规模深层神经网络需要算法创新和改进,使深度学习的性能和速度得到保障
- 训练大规模深层神经网络,需要强大的计算资源
2.图像识别与深度学习
图像识别:利用计算机对图像进行处理和分析,使机器能够理解图像中的内容。
图像识别核心问题:图像特征的提取
黑白图像可表示为二维张量、彩色图像可表示为三维张量
图像特征包含:形状特征、颜色特征、纹理特征
3.图像卷积
3.1 图像卷积运算
图像卷积运算:对图像中的每个像素点,用其周围像素点的灰度值加权求和调整该点的灰度值
卷积核/卷积模板 n×n
一般使用3×3、5×5、7×7
将图像和卷积核一一对应,加权求和
原图像变小解决办法:对于3×3,可以在原图外围补充一圈0、或将外围数字向外延展
步长(stride):卷积核一次移动的像素数
补偿等于卷积核的边长n时,相当于对图像缩小了n倍
3.2 图像卷积在机器学习中的应用
均值模糊
4领域平均法 | 8领域平均法
对图像进行模糊后,可以将图像中的高频噪声过滤掉。
所以对图像的卷积运算,也成称为平滑或者滤波。卷积核也称为滤波器。
卷积核越大、越模糊
高斯模糊:根据高斯分布的取值来确定权值。
高斯模糊在平滑物体表面的同时, 能够更好的保持图像的边缘和轮廓。
边缘检测:计算当前点和周围点的颜色值或灰度值的差别。
图像卷积就是提取特征的一个过程
4.卷积神经网络
Convolutional Neural Networks,CNN
感受野(receptive field):一个神经元所接受并相应的刺激区域
一个卷积核得到一种特征,多个卷积核得到多种特征,进行组合。
- 采用局部连接和权值共享机制
- 卷积核中的权值是从数据中学习得到的
卷积神经网络的结构
处在网络前端的特征层,用来捕捉图像局部细节信息;
后面的特征层,捕捉图像中更加抽象的信息。
卷积层:特征提取层
- 特征图
- 每个卷积层中包含有多个卷积核
- 激励函数:ReLU
池化层:特征映射层
- 下采样
- 在减小数据的处理量的同时,保留有用的信息
最大池化
在缩小图像的同时,对每个块中最亮的像素采样,从而得到图像的主要轮廓。
进一步获取更加抽象的信息
提高了泛化性,防止过拟合。
5.卷积神经网络的优化
dropout()
为了防止过拟合,在训练复杂的前馈型神经网络时,可以加入dropout操作
级联卷积核