【子豪兄】精讲CS231N斯坦福计算机视觉公开课学习笔记

司南锤

已于 2024-08-13 19:18:06 修改

阅读量1.9k

点赞数 35

分类专栏：深度学习学习笔记文章标签：计算机视觉学习笔记

于 2024-08-13 16:11:58 首次发布

本文链接：https://blog.csdn.net/qq_52964132/article/details/141166614

版权

深度学习同时被 2 个专栏收录

66 篇文章

订阅专栏

学习笔记

2 篇文章

订阅专栏

wx 搜索 gzh 司南锤，回复 子豪兄231笔记 可获取笔记文件（pdf+doc)

文章目录

学习链接:

【子豪兄】精讲CS231N斯坦福计算机视觉公开课（2020最新）_哔哩哔哩_bilibili

- 斯坦福大学公开课

- 计算机视觉发展历史

猫对边缘视觉敏感的研究：

ImageNet:

前置知识：

- 图像分类算法

CIFAR10数据集：

L1距离：
将两个位置对应的地方直接相减（曼哈顿距离）

LI距离python代码实现：

LI距离与L2距离对比：

L1距离对坐标系角度变化比较明显
L1距离适用于坐标系明确的情况：薪水和出勤

KNN图像分类的缺点：

运算比较慢
距离作为划分的特征不够明显
随着维度增加计算量快速增大

- 线性分类、损失函数与梯度下降

铰链损失函数：

正则化：

Softmax 分类器：交叉熵损失函数

导数：

数值解和解析解两种方式：

梯度下降算法：
是损失函数下降，不是梯度本身下降

SGD算法：

一般选择2的指数作为批次

- 神经网络与反向传播

类比自然神经元：

反向传播：

梯度流的形式：

向量的分类：

- 卷积神经网络

卷积核：

使用卷积核个数有多少，通道就有多少
卷积核的作用是提取特征

池化：

使得神经网络具有平移不变性
减少参数量
防止过拟合

- 可视化卷积神经网络

提取图像编码参数，进行降维之后进行可视化
遮挡实验

反卷积方法

- 训练神经网络（一）

- 激活函数

二分类可以使用sigmoid

数据预处理：

- 权重初始化

权重设置为同一个数？不行。这样每一个神经元的完全相同。

参数随机初始化？

该种初始化会导致梯度消失。

Xavier初始化

根据输入的维度进行确认。

在relu上不成立，该方法前提要求w和x关于0对称，但是relu>=0

Kaiming/MSRA Initialization 何凯明提出初始化方法【针对ReLU】

- Batch Normalization （批归一化）

测试时用训练全局的方差和均值的的数据代替批处理的。训练里面使用的每batch的一批的。

- 总结

- 训练神经网络（二）

- 优化器

传统随机梯度下降优化的缺点：

竖直方向上存在冗余的梯度

陷入局部最优点

– SGD

– SGD + 动量【Momentum】

– Nesterov Momentum 【NAG】

优化：先看动量下一步根据下一步再计算梯度

– AdaGrad

随着累加分母会变的越来越大，更新量会越来越小。

– RMSProp (Leakly AdaGrad)

引入了衰减因子，类似于动量中的ρ

– Adam( almost)

综合考虑了第一和第二动量

– Adam (full form)

- 学习率

如何评价一个好的学习率？

– 二阶优化法（牛顿法）

一阶导数除以二阶导数，无需设置学习率

海森矩阵有时候计算量比较大，所以不普遍应用，参数爆炸

采用拟牛顿法解决上述的问题。

- 防止过拟合

提前停止

- 模型集成

采用训练过程中不同时刻的模型进行集成；多个局部最优点进行集成学习

- 正则化

– Dropout

随机掐死一半的神经元，有效防止过拟合
每个神经元都能够独当一面，减少神经元中的联合依赖和适应性；起到模型集成的效果；找到了主要矛盾，起到了稀疏性
测试阶段不需要该操作，测试的时候需要补偿随机的P（0.5）
p=0.5能够使得各个神经元独立平等，不会出现部分神经元比重过大的情况，对应了 $2^n$ 个模型。缺点是训练时间增加了。
有效性的解释：