并行编程
leonordo
http://weibo.com/pkubrooks/home
展开
-
spark 1.1 mllib中 NaiveBayes 源码阅读
代码:mllib/api/classification/NaiveBayes.scala模型主要是三个变量, labels存储类别,pi存储各个label的prior, theta matrix存储各个词在各个类别中的条件概率。训练部分:代码的run部分首先是检测feature部分的值,必须是非负的。如果是伯努利分布的话,features是0,1的向量;多项式分布,feat原创 2014-12-30 18:20:41 · 2580 阅读 · 2 评论 -
参数服务器在分布式深度学习的应用
前几天仔细阅读distbelief的论文, 发现如下这篇文章对论文的分析比较到位,对论文不太懂的,可以看 http://blog.csdn.net/itplus/article/details/31831661,这里我转载内容:另外,可以参考wagnyi大牛的博客http://cxwangyi.github.io/2013/04/09/asynchronous-parameter-up转载 2014-12-09 18:11:49 · 6092 阅读 · 0 评论