参考B站视频
P1深度学习要解决的问题
自动进行特征提取
P2应用
深度学习在几万数据量上才表现的较好,数据量太小和传统人工智能算法没啥差别。
输入数据时,可以对输入的图片进行翻转镜面等操作。
李飞飞创建的数据集:
P3计算机视觉任务
定一个图片,计算机给出这个图片的标签
会遇到各种问题,比如背景融入、形状改变、遮蔽、拍摄角度等问题,需要加大数据量,多给出一些已知图片和标签的数据。
P4视觉任务中遇到的问题
采用k近邻算法容易以背景为主导
P5神经网络基础——得分函数
这里的得分函数大概就是权重,权重的意思也就是每个像素点属于猫或者狗这类结果的得分,下面这张图里,总共有10种分类结果。
P6损失函数的作用
P7前向传播整体流程
前向传播也就是顺着下来得到损失值或者概率值即可(暂时不考虑模型更新)
Softmax分类器可以得到概率值
P8反向传播计算方法
复习一下逻辑回归里的梯度下降,依靠梯度下降进行反向传播。
感觉这里更新的红色的值,只是走的一步。
P9、P10神经网络整体架构及细节
P11神经元个数对结果的影响
http://cs.stanford.edu/people/karpathy/convnetjs/demo/classify2d.html
可以去这个网站改神经元的个数观察,理论上是神经元个数越多越好,
不过28 、64是常见的神经元个数, 太多了会过拟合。
P12正则化与激活函数
P13神经网络过拟合的解决办法