深度学习day01【李宏毅】

最新推荐文章于 2024-06-18 15:06:20 发布

小鸡杂毛

最新推荐文章于 2024-06-18 15:06:20 发布

阅读量139

点赞数 1

分类专栏：机器学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44400573/article/details/98207569

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

深度学习day01

一、梯度下降法
二、Logitstic Regression
三、Deep Learning

一、梯度下降法

由于普通的梯度下降法的缺点，在驻点周围迭代步长很慢，容易达到局部最小值（此处不再介绍梯度下降法），引入了Adagrad

1.1 Adagrad

在这里插入图片描述

整体上也会越来越慢

在这里插入图片描述

一次微分/二次微分
其分母反映了二次微分的大小，一次微分的值平方和

1.2 Stochastic Gradient Descent

随机梯度下降法

在这里插入图片描述

每次只选择一个gradient Descent

1.3 Feature Scaling

特征缩放

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二、Logitstic Regression

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2.1 Logistic Regression为什么不用平方误差

求导、梯度下降法时不方便

2.2 Softmax

在这里插入图片描述

交叉熵函数写错了

2.3 Limitation of Logistic Regression

在这里插入图片描述

特征转换

在这里插入图片描述

在这里插入图片描述

图有问题，画反了
这样就得到了Deep Learning！

在这里插入图片描述

三、Deep Learning

在这里插入图片描述

在这里插入图片描述

向量化计算
概率大，就是哪个类

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习day01【李宏毅】

深度学习day01一、梯度下降法1.1 Adagrad1.2 Stochastic Gradient Descent1.3 Feature Scaling二、Logitstic Regression2.1 Logistic Regression为什么不用平方误差2.2 Softmax2.3 Limitation of Logistic Regression三、Deep Learning一、梯度下...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。