Spark和机器学习
文章平均质量分 82
iteye_20658
这个作者很懒,什么都没留下…
展开
-
spark结合Kmeans对数据标签化
概念:聚类算法是一种无监督学习任务,用于将对象分到具有高度相似性的聚类中. 举例:N个人有N多爱好,每个爱好提供出一个贡献值(或者称之为特征值),至于这个贡献值怎么得出目前不讨论.那么聚类算法就能实现根据这些特征值,把这N个人进行分组. 本人所在行业为轨道交通行业,致力于利用轴箱传感器采集到的数据进行故障诊断和预测.文中提到的数据源自真实采集数据.每行16个浮点型数值. 具体为: ...原创 2016-03-09 10:14:49 · 1104 阅读 · 2 评论 -
JavaSparkPi程序实现原理
在下载下来的spark里,有个样例程序叫做JavaSparkPi,大意是利用Spark的MapReduce函数求圆周率. 代码如下: /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTIC...原创 2016-03-09 17:06:55 · 484 阅读 · 0 评论