K-means对地震数据进行处理

最新推荐文章于 2024-04-12 09:54:20 发布

Perzival

最新推荐文章于 2024-04-12 09:54:20 发布

阅读量1.2k

点赞数 1

文章标签： kmeans 聚类数据挖掘

本文链接：https://blog.csdn.net/qq_51457257/article/details/122322787

版权

首先是……自用

用Spark来对地震数据进行分析，经过预处理后得到各地地震数据，用这些数据进行数据分析，首先是用K-means来求地震聚类

from  pyspark.ml.clustering  import  KMeans
kmeans=KMeans(k=17, seed=2147483648)

from pyspark.ml.feature import VectorAssembler

VectorAssembler =VectorAssembler(inputCols=["Latitude","Longitude","Year","Month", "Day"],outputCol="features")
new_df=VectorAssembler.transform(df)
print(new_df.head(1))
model=kmeans.fit(new_df)    #注意，传入的DataFrame是矢量名称为features的集合
centers=model.clusterCenters()  #产生聚类集合
print(centers)

transformed=model.transform(new_df)
print(transformed.head(1))
dataK = transformed.toPandas()

可视化部分

figK = px.scatter_geo(dataK,
                      color = dataK.prediction,
                      color_continuous_scale = px.colors.sequential.Inferno,
                      lon = dataK.Longitude,

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Perzival

关注关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
K-means对地震数据进行处理

首先是……自用用Spark来对地震数据进行分析，经过预处理后得到各地地震数据，用这些数据进行数据分析，首先是用K-means来求地震聚类from pyspark.ml.clustering import KMeanskmeans=KMeans(k=17, seed=2147483648)from pyspark.ml.feature import VectorAssemblerVectorAssembler =VectorAssembler(inputCols=["Latitude
复制链接

扫一扫