第十八章大规模机器学习

今天我要睡午觉

于 2021-06-30 01:01:54 发布

阅读量111

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blzhizhuang/article/details/118347402

版权

本文探讨了处理大数据集的挑战，重点介绍了随机梯度下降、Mini-Batch小批量梯度下降及其收敛性。此外，还讨论了在线学习算法如何适应不断变化的数据，并解释了如何通过减少映射与数据并行来加速训练过程。

摘要由CSDN通过智能技术生成

目录

1 学习大数据集

2 随机梯度下降

3 Mini-Batch小批量梯度下降

4 随机梯度下降收敛

5 在线学习算法

6 减少映射与数据并行

1 学习大数据集

在机器学习中，通常情况下，决定因素往往不是最好的算法，而是谁的训练数据最多。

如图所示，当数据量达到一亿时需要很久才能进行梯度下降，上图显示了大数据对于偏差有帮助，对方差帮助较少。因此我们需要找出合理的算法来处理大数据集。

2 随机梯度下降

随机梯度下降算法不需要处理所有训练样本，我们每次迭代只考虑一个训练样本。

具体过程：1，随机打乱所有数据

2，遍历所有样本，使参数对每个样本进行拟合。

这样做虽然中途会出现偏差，但最终会落到一个范围以内。

最低0.47元/天解锁文章

今天我要睡午觉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。