《机器学习-吴恩达》课程笔记Week10

最新推荐文章于 2024-07-10 16:08:35 发布

SofiaT

最新推荐文章于 2024-07-10 16:08:35 发布

阅读量107

点赞数

分类专栏：机器学习-吴恩达笔记文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SofiaT/article/details/125196047

版权

机器学习-吴恩达笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

目录

Large Scale Machine Learning

Gradient Descent with Large Datasets

Learning WithLarge Datasets

Stochastic Gradient Descent

Mini-Batch Gradient Descent

Stochastic Gradient Descent Convergence

Advanced Topics

Online Learning

Map Reduce and Data Parallelism

Large Scale Machine Learning

Gradient Descent with Large Datasets

Learning WithLarge Datasets

一般来说，设计得当的模型，喂给他们的数据集越大，得到的训练效果越好，但同时需要的计算资源/时间/开销也越大。

Stochastic Gradient Descent

随机梯度下降算法的核心步骤是：

1. 随机排列dataset

2. 随机下降的每一步，都选一个未被选中的train data，来更新theta，直到所有的data都被选过一遍

这样在面对大数据量data时避免了sum up所有的数据带来的内存和时间消耗。每一步下降的方向不一定最优，但最终会到global min范围附近。

Mini-Batch Gradient Descent

已涉及到的三种gradient descent区别如下：

mini-batch是介于批梯度下降和随机梯度下降之间的算法，比批梯度下降快，并行化好时也可比随机梯度下降更快。

Stochastic Gradient Descent Convergence

为了检查alpha是否合适，以及随机梯度下降是否收敛，可以借助画图的方式，例如每1000次更新后画出当前的损失函数值：

一些常见的图像如下：

按照左上、右上、左下、右下依次介绍。

图1为选取不同alpha时收敛的情况

图2为iteration每5000而非1000时会发生的情况，当画图迭代区间增大时，图像会趋于平滑，不过也会导致数据更新delay

图3为不收敛的图像，如果感觉震荡很大无法观察，可以调大区间。解决不收敛可能需要改alpha/特征值/算法模型

图4为alpha过大的图像，需要调小α

以上都是alpha为常量，事实上我们可以让它随着迭代而改变。但也有人不推荐这样做，因为这会使需要调整的参数增多，变量增多就需要更多的尝试来找到最佳解决方案。

Advanced Topics

Online Learning

实时学习模型。放弃了固有训练集的概念，而是记录Xi/Yi的数据到一个循环算法，之后不再使用这些数据。可以change user peference。

不是扫描固定的训练集，而是从一个例子中学习，然后丢弃它并继续，适合连续的数据流
尝试预测的事物正在缓慢变化，例如购物网站的用户品味在缓慢变化一样，在线学习算法可以慢慢适应

Map Reduce and Data Parallelism

使用map reduce能在处理比stochastic gradient descent更大规模上的数据。原理类似于分布式系统or多核处理器，把要计算的数据分拆，然后得到结果，再合并。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《机器学习-吴恩达》课程笔记Week10

数据集规模大的机器学习
复制链接

扫一扫

专栏目录

SofiaT CSDN认证博客专家 CSDN认证企业博客

码龄8年

51: 原创

16万+: 周排名

18万+: 总排名

3万+: 访问

: 等级

626: 积分

2: 粉丝

12: 获赞

3: 评论

75: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文管理工具：Zotero使用心得
SofiaT: 今天使用时发现有个小问题：在把记录的条目导出到别的设备上的Zotero中时，笔记中存的图片会消失……
transE论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
NEIL: Extracting Visual Knowledge from Web Data 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
多模态知识图谱构建系统论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。