机器学习项目实战——15Kmeans算法之NBA球队实力聚类分析

平行世界里的我

已于 2022-05-02 15:06:00 修改

阅读量1k

点赞数

分类专栏：机器学习文章标签：机器学习

于 2022-04-27 21:06:34 首次发布

本文链接：https://blog.csdn.net/weixin_45823221/article/details/124460728

版权

机器学习专栏收录该内容

35 篇文章 6 订阅

订阅专栏

聚类是无标签的就是无监督学习

整体代码：

from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

data = pd.read_csv('nba.csv')
print(data.head())

minmax_scaler = MinMaxScaler()
# 标准化数据
X = minmax_scaler.fit_transform(data.iloc[:,1:])
print(X[:5])

# 肘部法则选择k值
loss = []
for i in range(2, 10):
    model = KMeans(n_clusters=i).fit(X)
    loss.append(model.inertia_)

plt.plot(range(2, 10), loss)
plt.xlabel('k')
plt.ylabel('loss')
plt.show()




k = 4
model = KMeans(n_clusters=k).fit(X)

# 将标签整合到原始数据上
data['clusters'] = model.labels_

print(data.head())



for i in range(k):
    print('clusters:',i)
    label_data = data[data['clusters'] == i].iloc[:,0]
    print(label_data.values)