MLBase:Spark生态圈里的分布式机器学习系统
MLBase是Spark生态圈里的一部分,专门负责机器学习这块(出塔之外,还有负责图计算的GraphX、SQL ad-hoc查询的Shark、具备容错性查询能力的BlinkDB等)。看了MLBase的论文后,我是迫不及待想要分享一下这个ML系统。虽然对具体ML算法了解不多,但是对比类似的系统,比如Weka,Mahout而言,我感到MLBase的构想有更进一步的创新和独到之处。而且更重要的是,Spark上支持python算法包这件事情,我现在考虑的是:能打通策略组同学写的算法程序能依赖各节点上已经分配好的或自
原创
2013-09-05 20:57:32 ·
12255 阅读 ·
0 评论