吴恩达机器学习课程笔记+代码实现(26)17.大规模机器学习(Large Scale Machine Learning)

最新推荐文章于 2021-02-04 10:31:32 发布

geekxiaoz

最新推荐文章于 2021-02-04 10:31:32 发布

阅读量396

点赞数

分类专栏：吴恩达机器学习课程笔记+代码实现文章标签： SGD随机梯度下降吴恩达机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziqu5721/article/details/88619482

版权

本文介绍了在处理大规模数据集时，如何利用随机梯度下降（SGD）、小批量梯度下降以及在线学习策略来优化模型。随机梯度下降通过每次仅更新一个样本的梯度来降低计算成本，而在线学习则允许模型实时适应连续的数据流。此外，还讨论了映射化简和数据并行的概念，用于加速机器学习过程。

摘要由CSDN通过智能技术生成

17.大规模机器学习(Large Scale Machine Learning)

文章目录

17.大规模机器学习(Large Scale Machine Learning)

17.1 大型数据集的学习

如果我们有一个低方差的模型，增加数据集的规模可以帮助你获得更好的结果。我们应该怎样应对一个有100万条记录的训练集？

以线性回归模型为例，每一次梯度下降迭代，我们都需要计算训练集的误差的平方和，如果我们的学习算法需要有20次迭代，这便已经是非常大的计算代价。

首先应该做的事是去检查一个这么大规模的训练集是否真的必要，也许我们只用1000个训练集也能获得较好的效果，我们可以绘制学习曲线来帮助判断。

在这里插入图片描述

17.2 随机梯度下降法

如果我们一定需要一个大规模的训练集，我们可以尝试使用随机梯度下降法来代替批量梯度下降法。

在随机梯度下降法中，我们定义代价函数为一个单一训练实例的代价：

$cost\left( \theta, \left( {x}^{(i)} , {y}^{(i)} \right) \right) = \frac{1}{2}\left( {h}_{\theta}\left({x}^{(i)}\right)-{y}^{ {(i)}} \right)^{2}$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习课程笔记+代码实现(26)17.大规模机器学习(Large Scale Machine Learning)

17.大规模机器学习(Large Scale Machine Learning)文章目录17.大规模机器学习(Large Scale Machine Learning)17.1 大型数据集的学习17.2 随机梯度下降法17.3 小批量梯度下降17.4 随机梯度下降收敛17.5 在线学习17.6 映射化简和数据并行17.1 大型数据集的学习&nbsp; &nbsp; &nbsp; &nbsp...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。