K-means对地震数据进行处理

首先是……自用

用Spark来对地震数据进行分析,经过预处理后得到各地地震数据,用这些数据进行数据分析,首先是用K-means来求地震聚类

from  pyspark.ml.clustering  import  KMeans
kmeans=KMeans(k=17, seed=2147483648)

from pyspark.ml.feature import VectorAssembler

VectorAssembler =VectorAssembler(inputCols=["Latitude","Longitude","Year","Month", "Day"],outputCol="features")
new_df=VectorAssembler.transform(df)
print(new_df.head(1))
model=kmeans.fit(new_df)    #注意,传入的DataFrame是矢量名称为features的集合
centers=model.clusterCenters()  #产生聚类集合
print(centers)

transformed=model.transform(new_df)
print(transformed.head(1))
dataK = transformed.toPandas()

可视化部分

figK = px.scatter_geo(dataK,
                      color = dataK.prediction,
                      color_continuous_scale = px.colors.sequential.Inferno,
                      lon = dataK.Longitude,
                
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值