深度学习第一课线性回归

最新推荐文章于 2022-11-09 16:58:35 发布

Halo_Linch

最新推荐文章于 2022-11-09 16:58:35 发布

阅读量567

点赞数

分类专栏： DL 文章标签：线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dake13/article/details/83019857

版权

这篇博客介绍了深度学习中的线性回归，探讨了梯度下降、最小二乘法、牛顿法和拟牛顿法等优化算法的优缺点。通过MXnet/Gluon框架，详细阐述了线性回归的实现步骤，包括数据读取、参数初始化、正向传播、反向传播、模型训练和预测，并提到了MXnet的autograd()求导功能以及其他相关函数的用法。

摘要由CSDN通过智能技术生成

最近在学习李沐的Mxnet/Gluon深度学习的线性回归部分，线性回归是很基本的一种监督学习，分类问题。

以前学习完一遍吴恩达的《machine learning》，并把《机器学习实战》里面的主要代码都实现一遍，现在有点忘记了，正好开始深度学习，开始线性回归查缺补漏，MXnet框架其实比较小众，但这次学习主要是专注于算法的原理，框架只不过是工具。

这次温故而知新，现将需要的要点材料整理如下：

梯度下降可参考：https://www.cnblogs.com/pinard/p/5970503.html，小批量的随机梯度上升（下降）算法是对于整体样本的梯度上升（下降）算法与单个样本的随机梯度上升（下降）算法的折中，兼具了二者的优点。

在机器学习中的无约束优化算法，除了梯度下降以外，还有前面提到的最小二乘法，此外还有牛顿法和拟牛顿法。

　　　　梯度下降法和最小二乘法相比，梯度下降法需要选择步长，而最小二乘法不需要。梯度下降法是迭代求解，最小二乘法是计算解析解。如果样本量不算很大，且存在解析解，最小二乘法比起梯度下降法要有优势，计算速度很快。但是如果样本量很大，用最小二乘法由于需要求一个超级大的逆矩阵，这时就很难或者很慢才能求解解析解了，使用迭代的梯度下降法比较有优势。

　　　　梯度下降法和牛顿法/拟牛顿法相比，两者都是迭代求解，不过梯度下降法是梯度求解，而牛顿法/拟牛顿法是用二阶的海森矩阵的

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Halo_Linch CSDN认证博客专家 CSDN认证企业博客

码龄8年

20: 原创

111万+: 周排名

44万+: 总排名

9万+: 访问

: 等级

680: 积分

10: 粉丝

37: 获赞

4: 评论

85: 收藏

私信

关注

热门文章

分类专栏

DL 6篇
ML 3篇

最新评论

使用Pytorch对数据集CIFAR-10分类处理
weixin_57215233: 博主您好，请问我运行你的代码为啥过了很久都不出结果呀
Python 中矩阵或者数组相减的法则
lamprophony: （3，）自我复制。 e.g. x=array([1,2,3]) #（3,)实际为3行一列 y=array([[0],[0],[0]]) # (3,1)3行一列 x-y时： x自我复制变为: x1=([[1,2,3], [1,2,3], [1,2,3]]) # 3行1列 x1-y计算时，此时进行对应位置计算 [1,2,3]-[0]=[1,2,3] [1,2,3]-[0]=[1,2,3] [1,2,3]-[0]=[1,2,3]. 拙见
Python 中矩阵或者数组相减的法则
tree465: 那么(3，)要怎么转换为(3，1)
使用Pytorch对数据集CIFAR-10分类处理
起个名字废死劲: 博主你上面提到的百分之十是什么，我在测试的时候有时候会出现测试集的准确率是10.000%，而且无论多少次Epoch都是百分之10

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。