计算机视觉06：机器学习基础

最新推荐文章于 2024-06-03 08:46:27 发布

fafagege11520

最新推荐文章于 2024-06-03 08:46:27 发布

阅读量174

点赞数

分类专栏：计算机视觉文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fafagege11520/article/details/114343355

版权

计算机视觉专栏收录该内容

7 篇文章 1 订阅

订阅专栏

计算机视觉06：机器学习基础

1. 深度学习基础

1. 神经网络和深度学习

在这里插入图片描述

2. 目标函数

在这里插入图片描述

3. 激活函数

在这里插入图片描述

4. 学习步长

在这里插入图片描述
学习步长应该越来越小。

5.SGD（随机梯度下降）问题

在这里插入图片描述

1.动量（一阶）

在这里插入图片描述

2.Adagrad（二阶）

前面的sgd是对所有的参数统一求导和下降的，但是由于实际数据中可能存在这样一种情况：有些参数已经近乎最优，因此只需要微调了，而另一些可能还需要很大的调整。这种情况可能会在样本较少的情况下出现，比如含有某一特征的样本出现较少，因此被代入优化的次数也较少，这样就导致不同参数的下降不平衡。adagrad就是来处理这类问题的。
adagrad的基本想法是，对每个参数theta自适应的调节它的学习率，自适应的方法就是对每个参数乘以不同的系数，并且这个系数是通过之前累积的梯度大小的平方和决定的，也就是说，对于之前更新很多的，相对就可以慢一点，而对那些没怎么更新过的，就可以给一个大一些的学习率。
在这里插入图片描述

在这里插入图片描述
陡坡：小心往下走；缓坡：走的大步一些。

3. RMSprop（二阶）

这个实际上是对adagrad的一个改进，也就是把Adagrad对历史梯度加和变成了对历史梯度求均值（当然这个不是严格意义上的均值（含参数）），然后用这个均值代替Adagrad的累加的梯度和对当前梯度进行加权，并用来update。
用均值代替求和是为了解决Adagrad的学习率逐渐消失的问题。
在这里插入图片描述

4.Adam（1阶+2阶）

在这里插入图片描述

5. 各种梯度下降算法的比较

在这里插入图片描述

6. Batch Normalization（有点像正则化）

在这里插入图片描述

6. 避免过适应

在这里插入图片描述

1. 早期停止训练

在这里插入图片描述

2. 权重衰减

在这里插入图片描述

3. Dropout

在这里插入图片描述

2. CNN初步介绍

在这里插入图片描述

1. 卷积层

在这里插入图片描述

2. 池化层

在这里插入图片描述
池化和步长为2可以缩小。

3. CNN-Softmax

在这里插入图片描述

4. 卷积层的误差反向传播

重要链接

https://zhuanlan.zhihu.com/p/44361349
在这里插入图片描述

5. 池化层的误差反向传播

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
计算机视觉06：机器学习基础

计算机视觉06：机器学习基础文章目录计算机视觉06：机器学习基础1. 深度学习基础1. 神经网络和深度学习2. 目标函数3. 激活函数4. 学习步长5.SGD（随机梯度下降）问题1.动量2.Adagrad6.2. CNN初步介绍1. 深度学习基础1. 神经网络和深度学习2. 目标函数3. 激活函数4. 学习步长学习步长应该越来越小。5.SGD（随机梯度下降）问题1.动量2.Adagrad陡坡：小心往下走；缓坡：走的大步一些。6.2. CNN初步介绍..
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。