spark 实现K-means算法

最新推荐文章于 2024-05-30 08:43:01 发布

爱吃草莓的西瓜酱

最新推荐文章于 2024-05-30 08:43:01 发布

阅读量1.1k

点赞数 2

分类专栏：分布式模型与编程文章标签： spark kmeans RDD Java

本文链接：https://blog.csdn.net/weixin_41045344/article/details/83963056

版权

本文介绍了如何利用Spark进行K-means算法的实现，重点在于处理数据集`data.dat`，该数据文件包含了所有点的坐标信息。

摘要由CSDN通过智能技术生成

spark 实现K-means算法

package kmeans;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;.
import java.util.Arrays;
import java.util.Iterator;


import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;


import scala.Tuple2;



public class kmeans{
   
  static double[][] center = new double[4][2];  //这里有4个中心点，为2维
  static int[] number = new int[4];           //记录属于当前中心点的数据的个数，方便做除法
  static double[][] new_center = new double[4][2];    //计算出来的新中心点
  public static void main(String[] args) {
   

    // 从文件中读出中心点，并且放入center数组中
    ArrayList<String> arrayList = new ArrayList<String>();
    try {
   
      File file = new File("/usr/local/hadoop-2.7.3/centers.txt");
      InputStreamReader input = new InputStreamReader(new FileInputStream(file));
      BufferedReader bf = new BufferedReader(input);
      // 按行读取字符串
      String str;
      while ((str = bf

最低0.47元/天解锁文章

爱吃草莓的西瓜酱

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
4
评论
spark 实现K-means算法

spark 实现K-means算法package kmeans;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.I...
复制链接

扫一扫

专栏目录