- 博客(5)
- 资源 (11)
- 问答 (1)
- 收藏
- 关注
原创 kmeans各种
一、 scala> def loadLibSVMFile(sc:SparkContext,path:String,numFeatures:Int,mainPartitions:Int): RDD[LabeledPoint]={ | val parsed =sc. textFile("/home/sc/Desktop/data.txt",2) | val parsed =s
2016-08-28 23:20:46 529
原创 spark,scala并行求和
scala> val text=sc.textFile("/home/sc/Desktop/data.txt") 16/08/08 02:57:19 INFO MemoryStore: Block broadcast_4 stored as values in memory (estimated size 38.8 KB, free 124.7 KB) 16/08/08 02:
2016-08-28 23:18:57 6080
原创 RDD[Vector]
1.629502 1.66991 1.871226 1.898365 1.46171 1.91306 1.58579 1.537943 2.018275 1.836801 1.98899 2.006619 1.599317 1.991072 1.991236 1.235661 1.057009 1.601767 1.889463 1.86318 1.368395 1.21388
2016-08-28 23:17:10 2350
原创 submit SparkKMeans
spark-submit --class "org.apache.spark.examples.SparkKMeans" --master local[4] /opt/spark/spark-1.6.1-bin-hadoop1/lib/spark-examples-1.6.1-hadoop1.2.1.jar /home/sc/Desktop/data.txt 2 0.0001 1
2016-08-28 23:15:24 1098
原创 Kmeans系统理论总结上
一、背景 聚类( Cluster analysis)有时也被翻译为簇类,其核心任务是将一组目标object划分为若干个簇,每个簇之间的object尽可能相似,簇与簇之间的object尽可能相异。聚类算法是机器学习(或者说是数据挖掘更合适)中重要的一部分,除了最为简单的K-Means聚类算法外,比较常见的还有层次法(CURE, CHAMELEON等)、网格算法(STING, WaveClust
2016-08-09 12:33:51 1838
U8125 SchemaDoc.chm
2020-04-15
06-助力AI生态布局,昇腾云服务器案例解读.pdf
2019-11-14
数据结构与算法分析pdf
2017-06-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人