sklearn实现k-means聚类算法（气温数据集）matplotlib可视化

最新推荐文章于 2024-07-30 21:02:40 发布

智商25的憨憨

最新推荐文章于 2024-07-30 21:02:40 发布

阅读量3.2k

点赞数 1

分类专栏：代码机器学习

本文链接：https://blog.csdn.net/gxc19971128/article/details/106731334

版权

该博客介绍了如何运用sklearn库的k-means算法对气温数据进行聚类，并通过matplotlib进行可视化展示。虽然聚类结果的实际应用意义有限，但可以作为学习示例。

摘要由CSDN通过智能技术生成

只是做个测试，最终聚类出来的信息实际应用意义不大。大家可以用sklearn中的兰花数据集进行测试，。

我的数据集样式如下：

import numpy as np
from sklearn.cluster import KMeans

import matplotlib.pyplot as plt
import pandas as pd

x_sky_train = pd.read_csv('datadatadata1.csv',usecols = [2,3],header=None)
#将读取的数据转化为numpy数组
x_sky_train1 = x_sky_train.values
print(x_sky_train1)
#print(x_sky_train)
print(np.shape(x_sky_train1))
#构造聚类器
clf = KMeans(n_clusters=6)
#开始聚类
y_sky_train = clf.fit_predict(x_sky_train1)
#获得聚类标签
label_clf = clf.labels_
print(label_clf)
#获得聚类中心,保存在df_center的DataFrame中给数据加上标签
center = clf.cluster_centers_
df_center = pd.DataFrame(center, columns=['x', 'y'])
df = pd.DataFrame(x_sky_train1, index=label_clf, columns=['x', 'y'])

df1 = df[df.index==0]