spark:kmeans测试

最新推荐文章于 2023-11-22 19:50:03 发布

ASD991936157

最新推荐文章于 2023-11-22 19:50:03 发布

阅读量752

点赞数

本文链接：https://blog.csdn.net/asd991936157/article/details/51940338

版权

import org.apache.spark.ml.clustering.KMeans
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.sql.SQLContext
import org.apache.spark.{SparkContext, SparkConf}

/**
  * Created by fhqplzj on 16-7-18 at 上午11:02.
  */
object TestKMeans {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[*]").setAppName("TestKMeans")
    val sc = new SparkContext(conf)
    val sqlContext = new SQLContext(sc)
    val input = "/home/fhqplzj/github/spark-1.6.1/data/mllib/kmeans_data.txt"
    val rowRDD = sc.textFile(input).filter(_.nonEmpty).map(s => Vectors.dense(s.split("\\s+").map(_.toDouble))).zipWithIndex().map(_.swap)
    val dataset = sqlContext.createDataFrame(rowRDD).toDF("id", "features")
    val model = new KMeans().setK(2).setFeaturesCol("features").setPredictionCol("prediction").fit(dataset)
    println("Cluster centers:")
    model.clusterCenters.foreach(println)
  }
}

优惠劵

ASD991936157

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark:kmeans测试

import org.apache.spark.ml.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.sql.SQLContextimport org.apache.spark.{SparkContext, SparkConf}/** * Created by f
复制链接

扫一扫