Spark MLlib
霄嵩
这个作者很懒,什么都没留下…
展开
-
Spark MLlib数据类型——本地向量
import org.apache.spark.mllib.linalg import org.apache.spark.mllib.linalg.Vectors object DataTypeDemo { def main(args: Array[String]): Unit = { /** * MLlib数据类型——本地向量 * 本地向量[Local Ve...原创 2018-08-03 20:43:51 · 802 阅读 · 0 评论 -
Spark MLlib——使用逻辑回归算法进行邮件分类
import org.apache.log4j.{Level, Logger} import org.apache.spark.mllib.classification.{LogisticRegressionModel, LogisticRegressionWithSGD} import org.apache.spark.mllib.feature.HashingTF import org.apa...原创 2018-08-03 23:08:53 · 818 阅读 · 0 评论 -
SparkMLlib——K-Means算法解析与Demo
/** * K-Means是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。 * 给定数据样本集Sample和应该划分的类数K,对样本数据Sample进行聚类,最终形成K个聚类。 * 其相似的度量是某条数据与中心点的“距离”。 * 这里所说的距离是欧式距离,它是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。 * 对于K-Means算法,它的执行过程可...原创 2018-11-03 22:53:51 · 551 阅读 · 0 评论