- 博客(3)
- 资源 (7)
- 收藏
- 关注
原创 spark 1.1 mllib中 NaiveBayes 源码阅读
代码:mllib/api/classification/NaiveBayes.scala模型主要是三个变量, labels存储类别,pi存储各个label的prior, theta matrix存储各个词在各个类别中的条件概率。训练部分:代码的run部分首先是检测feature部分的值,必须是非负的。如果是伯努利分布的话,features是0,1的向量;多项式分布,feat
2014-12-30 18:20:41 2579 2
原创 如何用python画好confusion matrix
在做分类的时候,经常需要画混淆矩阵,下面我们使用python的matplotlib包,scikit-learning机器学习库也同样提供了例子:http://scikit-learn.org/stable/auto_examples/plot_confusion_matrix.html, 但是这样的图并不能满足我们的要求,首先是刻度的显示是在方格的中间,这需要隐藏刻度,其次是如何把每个
2014-12-20 22:41:04 40684 5
转载 参数服务器在分布式深度学习的应用
前几天仔细阅读distbelief的论文, 发现如下这篇文章对论文的分析比较到位,对论文不太懂的,可以看 http://blog.csdn.net/itplus/article/details/31831661,这里我转载内容:另外,可以参考wagnyi大牛的博客http://cxwangyi.github.io/2013/04/09/asynchronous-parameter-up
2014-12-09 18:11:49 6092
Software Architecture4+1
2009-03-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人