Python scikit-learn，非监督学习 (没有目标值)，k-means聚类算法，KMeans

最新推荐文章于 2023-02-22 23:45:39 发布

houyanhua1

最新推荐文章于 2023-02-22 23:45:39 发布

阅读量403

点赞数

分类专栏： Python+ 机器学习文章标签： Python k-means 聚类 KMeans

本文链接：https://blog.csdn.net/houyanhua1/article/details/88077128

版权

本文探讨了Python中的非监督学习方法——k-means聚类算法，特别是使用KMeans类进行聚类，并通过轮廓系数进行效果评估。k-means算法在实践中通常先于分类预测步骤，其优点在于迭代式算法的直观性和实用性。然而，该算法可能只得到局部最优解，而非全局最优，可以通过多次运行来改善结果。

摘要由CSDN通过智能技术生成

k-means，k表示聚类的目标类别数(如果不知道,就是超参数)

一般应用中是先进行k-means聚类，然后再进行分类预测。

demo.py（k-means聚类，通过轮廓系数进行评估）：

import pandas as pd
from sklearn.decomposition import  PCA
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score


# K-means 聚类   根据用户商品订单数据进行聚类。预测用户对某商品的喜好程度。
data = pd.read_csv("./demo.csv")

# 特征降维  PCA主成分分析
pca = PCA(n_components=0.9)  # 保留90%的信息
data = pca.fit_transform(data)
print(data.shape)  # (500, 27)   500个样本，降维到27个特征

最低0.47元/天解锁文章

houyanhua1

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python scikit-learn，非监督学习 (没有目标值)，k-means聚类算法，KMeans

k-means，k表示聚类的目标类别数(如果不知道,就是超参数)一般应用中是先进行k-means聚类，然后再进行分类预测。demo.py（k-means聚类，通过轮廓系数进行评估）：import pandas as pdfrom sklearn.decomposition import PCAfrom sklearn.cluster import KMeansfr...
复制链接

扫一扫

专栏目录