Spark机器学习库MLlib

最新推荐文章于 2021-06-11 11:58:41 发布

chongjiapi1753

最新推荐文章于 2021-06-11 11:58:41 发布

阅读量209

点赞数

文章标签：人工智能大数据

原文链接：https://my.oschina.net/u/3575262/blog/1585597

版权

Spark MLlib与Hadoop Mahout，可以对比着学习，以下是MLlib主要支持的机器学习算法

【转自赖永炫老师的个人博文】MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。具体来说，其主要包括以下几方面的内容：

Spark 机器学习库从 1.2 版本以后被分为两个包：

spark.mllib包含基于RDD的原始算法API。Spark MLlib 历史比较长，在1.0 以前的版本即已经包含了，提供的算法实现都是基于原始的 RDD。
spark.ml 则提供了基于DataFrames 高层次的API，可以用来构建机器学习工作流（PipeLine）。ML Pipeline 弥补了原始 MLlib 库的不足，向用户提供了一个基于 DataFrame 的机器学习工作流式 API 套件。

转载于:https://my.oschina.net/u/3575262/blog/1585597

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注