机器学习10：大规模数据学习

最新推荐文章于 2024-08-19 00:00:00 发布

国易

最新推荐文章于 2024-08-19 00:00:00 发布

阅读量452

点赞数

分类专栏：王恩达机器学习入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wycgi/article/details/84978977

版权

本文探讨大规模数据集学习，重点介绍了随机梯度下降、小批量梯度下降及其收敛性，解释了在线学习的概念，并通过航运服务和产品搜索的例子展示了在线学习的应用。此外，还提及了映射约减作为加速训练的方法。

摘要由CSDN通过智能技术生成

大规模数据学习

大规模数据集学习
在线学习
映射约减

大规模数据集学习

得数据者得天下，一般而言，在进行机器学习时，比较好的情况时拥有大量的数据以及高方差(过拟合)的模型。

在处理大量数据前，可以利用之前在另一篇博文中提到的学习曲线，查看模型是高偏差还是高方差，确定是高方差后再处理大量数据：
在这里插入图片描述

随机梯度下降

原梯度下降(批量(Batch)梯度下降)过程：
在这里插入图片描述
如上图，每更新一个参数，便需要循环m次

随机梯度下降过程：
在这里插入图片描述

如上图，用一个样本来更新所有模型参数 $\theta$ ，即可使参数立刻获得更新，加快迭代速度，且所有样本都遍历更新的这个大循环过程，重复1至10次即可。
PS：注意上图，需要先把样本的顺序打乱再进行梯度下降，以免产生影响。

批量梯度下降与随机梯度下降在下降过程中的区别在于，批量梯度下降直接逼近最小值，而随机梯度下降则曲折接近最小值，最后在最小值附近徘徊

小批量梯度下降

小批量梯度下降介于批量梯度下降和随机梯度下降之间，其过程为：
在这里插入图片描述

如上图，用不断用b个样本更新参数，直至遍历所有样本为一个大循环。

随机梯度下降的收敛

对于批量梯度下降而言，在每次迭代后&#x

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。