sparkMlib
光脚丫丫
这个作者很懒,什么都没留下…
展开
-
Spark MLlib学习(一)数据类型 Data Types
MLlib是spark的机器学习库,有常用学习算法和实用工具,包括分类、回归、聚类、协同过滤、降维等。分为两个部分: spark.mllib 基于RDDs的原有API spark.ml 提供了基于DataFrame的高水平API用于建立ML pipelines 推荐使用spark.ml(基于DataFrame的API更加多样化,更灵活),不过spark也持续支持spark原创 2016-05-11 18:41:53 · 2411 阅读 · 0 评论 -
Spark MLlib学习(二)——分类和回归
MLlib支持多种分类方法,如二分类、多分类和回归分析等。问题类型 支持的方法 二分类 线性SVM, 逻辑回归,决策树,随机森林,GBDT,朴素贝叶斯 多分类 决策树,随机森林,朴素贝叶斯 回归原创 2016-05-16 19:27:47 · 8707 阅读 · 1 评论