![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
课设
文章平均质量分 53
jQueryZK
本科在校软件专业学生,正在奔向程序员的道路上
展开
-
3-整合·
数据量太大,换成 kddcup.data_10_percent( 为抽样去重后10%的实验数据) package NetWork import org.apache.spark.mllib.clustering.{KMeansModel, KMeans} import org.apache.spark.mllib.linalg.{Vectors,Vector} import org.apache.spark.rdd.RDD import org.apache.spark.{SparkContext,原创 2021-06-13 20:53:32 · 287 阅读 · 0 评论 -
2-算法实操
单例对象里面封装了欧氏距离公式和将欧氏距离应用到model中,还有计算k值model平均质心距离和对k的取值进行评价的方法 package NetWork import org.apache.spark.mllib.clustering.{KMeans, KMeansModel} import org.apache.spark.mllib.linalg.Vector import org.apache.spark.rdd.RDD /** *单例对象里面封装了欧氏距离公式和将欧氏距离应用到model中,原创 2021-06-13 20:48:35 · 274 阅读 · 0 评论 -
1-环境搭建
环境搭建 群起Zookeeper 群起HDFS 群起YARN 将数据文件传到Linux系统 在HDFS文件上新建一个文件夹 将数据文件上传到HDFS文件系统原创 2021-06-13 20:43:19 · 264 阅读 · 0 评论