《大数据日知录》读书笔记-ch16机器学习：分布式算法

最新推荐文章于 2024-09-25 23:58:26 发布

weixin_30361641

最新推荐文章于 2024-09-25 23:58:26 发布

阅读量194

点赞数

文章标签：数据结构与算法大数据人工智能

原文链接：http://www.cnblogs.com/yaoyaohust/p/10683291.html

版权

计算广告：逻辑回归

千次展示收益eCPM（Effective Cost Per Mille）

eCPM= CTR * BidPrice

优化算法

训练数据使用：在线学习（online learning）、批学习（batch learning）、mini-batch学习

数据量往往千万到几亿，模型参数达到10~100亿 .

并行随机梯度下降（Parallel Stochastic Gradient Descent）：

批学习并行逻辑回归：

重点在计算梯度。

step1 算内积

step2 按行聚合

step3 按列聚合（得到每维参数的梯度）

深度学习：DistBelief

深度学习可以使用海量数据做无监督预训练（Pre-training），所以需要分布式架构

浅层结构学习算法：GMM，HMM，CRF，MaxEnt，SVM，LR，单隐层MLP

多层受限玻尔兹曼机（Restricted Boltzmann Machines）逐层叠加形成深度新年网络（Deep Belief Network，DBN）。训练复杂度和NN的规模呈线性关系。

DistBelief同时支持数据并行和模型并行。

1. Downpour SGD

online learning方式。用mini-batch方式异步SGD更新参数

异步的含义：每个副本模型（Model Replica）各自异步执行；参数服务器的数据分片相互独立，不做同步更新

对比同步SGD，异步SGD有更好容错性。实验效果表明，计算精度可达到类似算法相近的结果。

2. Sandblaster L-BFGS

batch learning方式。有同步过程。

转载于:https://www.cnblogs.com/yaoyaohust/p/10683291.html

weixin_30361641

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。