视频笔记,视频链接地址:https://www.bilibili.com/video/BV1b7411T7DA
卷积神经网络
包含了卷积层的都可以认为是卷积神经网络
应用:图像分类、图像检索、目标检测、图像分割、无人驾驶
GPU比CPU速度快很多,大概在20倍
全连接层
将一个特征矩阵展开成行向量或列向量,然后进行运算
one-hot编码是常用的对标签编码的一种方式
许多神经元全连接得来的
x1x2x3是3个激励,w1w2w3是3个权重,相乘求和再加激励函数,再通过偏置,得到一个输出
BP神经网络,每列之间各元素全连接
网络的正向传播的输出值和期望的输出值相比,得到一个误差值
通过计算每一个节点的偏导数,就能得到每个节点的误差梯度
卷积层
CNN中独特的网络结构,卷积就是一个滑动窗口,在特征图上相乘相加进行计算
卷积核的深度和输入特征层的深度相同
【比如输入特征层是3维的,卷积核就是3维的】
输出特征矩阵的深度和卷积核个数相同
不建议刚开始就使用很大的学习率去学习,会导致很多神经元失活
池化层
maxpool——找最大值、avgpool——找平均值
目的:对特征图进行稀疏处理,减少数据运算量
特点:
池化核poolsize和步距stride大小是相同的
误差的计算
瞬时梯度gradient,并不一定是全局最优的方向
当使用分批次求解时,梯度并不是全局最优的梯度下降的方向,收敛速度比较慢
使用优化器去加快收敛速度
SGD有一定的局限性,针对可能陷入局部最优解的问题,有以下优化方案
Adam常用,还有SGD+momoentum,但是实际可以多尝试对比