蜗龙徒行-Spark学习笔记【二】Spark shell下kmeans聚类算法的应用

最新推荐文章于 2022-05-21 09:51:24 发布

网埠头

最新推荐文章于 2022-05-21 09:51:24 发布

阅读量2.2k

点赞数

分类专栏： Spark Scala 机器学习文章标签：算法 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cafuc46wingw/article/details/44648129

版权

Spark 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

在终端打开spark-shell

然后在scala编辑模式下依次输入以下命令：

//导入算法执行所需函数库

import org.apache.spark.mllib.clustering.KMeans

import org.apache.spark.mllib.linalg.Vectors

// 加载并分析数据

val data = sc.textFile("data/mllib/kmeans_data.txt")

val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))).cache()

// 用算法将数据聚类成两个簇，用数据集来训练kmeans算法
val numClusters = 2

val numIterations = 20

val clusters = KMeans.train(parsedData, numClusters, numIterations)

//提取聚类结果

val clusterCenters = clusters.clusterCenters

//聚类结果标签

val labels=clusters.predict(parsedData)

//保存聚类结果

labels.saveAsTextFile("/output/kmeansTest/result")

// 误差分析，评价聚类的计算在规定的误差平方和
val WSSSE = clusters.computeCost(parsedData)
println("Within Set Sum of Squared Errors = " + WSSSE)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
蜗龙徒行-Spark学习笔记【二】Spark shell下kmeans聚类算法的应用

在终端打开spark-shell然后在scala编辑模式下依次输入以下命令：//导入算法执行所需函数库import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectors// 加载并分析数据val data = sc.textFile("data
复制链接

扫一扫

专栏目录

网埠头 CSDN认证博客专家 CSDN认证企业博客

码龄14年

27: 原创

19万+: 周排名

157万+: 总排名

16万+: 访问

: 等级

2024: 积分

14: 粉丝

8: 获赞

6: 评论

61: 收藏

私信

关注

热门文章

分类专栏

机器学习 4篇
数据结构/算法 3篇
Java 1篇
MySQL 5篇
Scala 4篇
Spark 5篇
Hadoop 7篇
Python
JavaScript 1篇
C/C++ 17篇
编程利器 4篇
项目管理 6篇
架构设计 1篇
操作系统 8篇
论文写作 1篇
进阶资源 1篇

最新评论

Hadoop小兵笔记【六】hadoop2.2.0伪分布式环境搭建疑难-JobHistory显示Job信息为空
500@h: 不是这样的吧，配置问题
JQuery的用途和功能
weixin_45180064: 阅读 jQuery库为Web脚本编程提供了通用的抽象层，使得它几乎适用于任何编程的情形。由天它容易扩展而且不断有新插件面世增强它的功能，所以这里无法涵盖它所有可能的用途和功能。抛开这些就其核心特性而言，jQuery能够满足下列需求：一、取得页面中的元素。如果不使用JavaScript库，遍历DOM树，以及查找HTML文档结构中某个特殊的部分，必需编写很多代码。jQuery为准确获取需要操纵的文档元素，提供了可靠而富有效率的选择符机制。二、修改页面的外观。 CSS虽然为呈现方式提供了一种强大的手段，但当所有浏览器不完全支持相同的标准时，单纯使用CSS就会显得力不从心。jQuery可以弥补这一不足，它提供了跨浏览器的标准来解决方案。而且即使在页面已经呈现之后，jQuery仍然能够改变文档中某个部分的类或都个别的样式属性。三、改变页面的内容。 jQuery能够影响的范围并不局限于简单的外观变化，使用少量的代码，jQuery就能改变文档的内容，可以改变文本、插入或都翻转图像、对列表重新排序，甚至对HTML文档的整个结构都能重写和扩充——所有这些只需要一个简单易用的API。四、响应用户的页面操作。即使是最强大和最精心的设计的行为，如果我们无法控制它何时发生，那它也毫无用处。jQuery提供了截取形形色色的页面事件（比如用户单击一个链接）的适当方式，而不需要使用事件处理程序搞乱HTML代码。此外，它的事件处理API也消除了经常困扰Web开发人员的浏览器不一致性。五、为页面添加动态效果。为了实现某种交互式行为，设计者也必须向用户提供视觉上的反馈。jQuery中内置的一批淡入、擦除之类的效果，以及制作新效果的工具包，为此提供了便利。六、无需刷新页面。即可从服务器获取信息，这种编程模式就是从所周知的AJAX（Asyynchoronous JavaScript and XML），它能辅助Web开发人员创建出反应灵敏、功能丰富的网站。jQuery通过消除这一过程中的浏览器特定的复杂性，使开发人员得以专注于服务器端的功能设计。七、简化常见的JavaScript任务。除了这些完全针对文档的特性之外，jQuery也提供了对基本的JavaScript结构（例如迭代和数组操作等）的增强。
MyEclipse实操错误2:Some characters cannot be mapped using "GBK" character encoding
松下的博客: 感谢
数据结构_任意N个元素有多少种出栈顺序(卡特兰数证明)
include????: 懂了，博主的折线图针不戳，赞(/≧▽≦/)
蜗龙徒行-Spark学习笔记【五】IDEA中集群运行模式的配置
怎么全部重名了: 你好能加一下你的联系方式么？我有个问题

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。