15-Large Scale Machine Learning

最新推荐文章于 2022-06-09 20:54:01 发布

DawnRanger

最新推荐文章于 2022-06-09 20:54:01 发布

阅读量903

点赞数

分类专栏： machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DawnRanger/article/details/48169253

版权

machine-learning 专栏收录该内容

22 篇文章 1 订阅

订阅专栏

1 - Learning With Large Datasets

由前面章节的知识可知，在模型属于 low bias & high variance 的时候，增大数据集是对结果大有好处的。
Andrew NG 给的示例：
big data set

2 - Stochastic [sto’kæstɪk] Gradient Descent 随机梯度下降

常见的 Linear Regression 的梯度下降算法：
linear gradient descent
它的特征是每次迭代都需要对所有的训练数据进行一次遍历，在数据集非常大的时候算法运行会比较慢。

改进后的 Stochastic gredient descent 算法：
stochastic gradient descent
每次迭代只使用一个训练数据，每个训练数据都对参数θ的改进有一些影响。这样在数据量较大的时候运行速度能明显提升。缺点是收敛过程可能是波动的。

3 - Mini-Batch Gradient Descent

Batch gradient descent 与 stochastic gradeint descent 的折中：

Batch gradient descent: Use **all m **examples in each iteration
Stochastic gradient descent: Use 1 example in each iteration
Mini-batch gradient descent: Use b examples in each iteration

mini-batch

4 - Stochastic Gradient Descent Convergence 随机梯度下降算法的收敛性

Checking for convergence：

Batch gradient descent：每迭代一次计算一次 $J(\theta)$ ,绘制出 $J(\theta)$ 随迭代次数的变化情况。
Stochastic gradient descent：每1000次迭代绘制一次 $cost(\theta,(x^{(i)},y^{(i)}))$ 。

convergence

5- Online Learning 在线学习

训练数据不是一开始就有的，而是在不断地动态生成。
假设样例到来的先后顺序为 $(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),\dots,(x^{(n)},y^{(n)})$ ，X为样本特征，y为类别标签。我们的任务是到来一个样例x，给出其类别结果y的预测值，之后我们会看到y的真实值，然后根据真实值来重新调整模型参数，整个过程是重复迭代的过程，直到所有的样例完成.
online learning

6 - Map Reduce and Data Parallelism

算法思想：发挥计算机的硬件性能，在多核计算机或计算集群上进行大数据量的学习。

map reduce

哪些情况下可以使用 Map reduce 算法：

Many learning algorithms can be expressed as computing sums of functions over the training set.

算法步骤中出现了对训练数据的求和的情况，那么就可以将任务划分到堕胎计算机上进行处理。
例如：

e.g

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
15-Large Scale Machine Learning

1 - Learning With Large Datasets由前面章节的知识可知，在模型属于 low bias & high variance 的时候，增大数据集是对结果大有好处的。 Andrew NG 给的示例： 2 - Stochastic [sto’kæstɪk] Gradient Descent 随机梯度下降常见的 Linear Regression 的梯度下降算法：它的特
复制链接

扫一扫

专栏目录

DawnRanger CSDN认证博客专家 CSDN认证企业博客

码龄10年

89: 原创

13万+: 周排名

225万+: 总排名

37万+: 访问

: 等级

3751: 积分

98: 粉丝

144: 获赞

48: 评论

276: 收藏

私信

关注

热门文章

分类专栏

最新评论

python实现静态变量
iamthebest100: class Foo(object): count = 0 f1 = Foo() f2 = Foo() f1.count = 1 print(f1.count, f2.count) # 结果: 1 0 这代码在其他语言中挺正常的啊~~~~
Python 星号表达式(starred expression)
lyitcc: 这种星号表达式被赋值对象只能支持，列表和元组类型，加个逗号是声明此对象是个元组类型，加个中括号也可以
Python 星号表达式(starred expression)
须弥互联网首席指挥官: [code=python] a,*b=range(5) a Out[168]: 0 b Out[169]: [1, 2, 3, 4] a,b,*c,d=range(6) c Out[171]: [2, 3, 4] a,*b,*c=range(5) File "<ipython-input-172-5d7c8a815e8a>", line 1 a,*b,*c=range(5) ^ SyntaxError: two starred expressions in assignment a,b,*c=range(5),range(5) a Out[174]: range(0, 5) b Out[175]: range(0, 5) c Out[176]: [] range(5),*range(5) Out[177]: (range(0, 5), 0, 1, 2, 3, 4) *range(5),*range(5) Out[178]: (0, 1, 2, 3, 4, 0, 1, 2, 3, 4) a,b,*c=range(5),*range(5) a Out[184]: range(0, 5) b Out[185]: 0 c Out[186]: [1, 2, 3, 4] [/code] 多看一些例子就懂了
过滤非utf-8字符
锦鱼不忘旧时晨: 给个非utf-8的字符测试一下啥，你测试了吗？大哥
python实现静态变量
szh_19840508: 其实应该在get_count和set_count两个方法前加上@staticmethod

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。