数据分析项目基于K-Means算法的广告聚类分析（5）----KMeans建模：基于平均轮廓系数，找到最佳K值

最新推荐文章于 2024-06-03 12:45:37 发布

Deep,dark,fantasy

最新推荐文章于 2024-06-03 12:45:37 发布

阅读量1.4k

点赞数

分类专栏：数据分析项目文章标签： python 聚类数据分析

本文链接：https://blog.csdn.net/qq_43709590/article/details/115765985

版权

一、基于K-Means获取最佳K值

score_list = []
max_score = -1
for k in range(2, 6):  # 2，3，4，5
    kmeans_model = KMeans(n_clusters=k)  # 建模
    kmeans_temp = kmeans_model.fit_predict(data_matrix)  # 计算点距离
    # print(kmeans_temp)
    score = silhouette_score(data_matrix, kmeans_temp)  # 得到每个K下的平均轮廓系数
    # 获取最佳k值
    if score > max_score:  # 如果平均轮廓系数更高
        max_score = score  # 保存更高的系数值
        best_k = k  # 保存最佳的k值
        labels_temp = kmeans_temp  # 保存标签数据
    # print(k, score)
    score_list.append([k, score])  # 存每一次的k值和对应的平均轮廓系数
# print('{:*^60}'.format('所有的k值以及对应平均轮廓系数'))
print(score_list)
print('最佳K值：', best_k)

结果

[[2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Deep,dark,fantasy

关注关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
数据分析项目基于K-Means算法的广告聚类分析（5）----KMeans建模：基于平均轮廓系数，找到最佳K值

一、基于K-Means获取最佳K值score_list = []max_score = -1for k in range(2, 6): # 2，3，4，5 kmeans_model = KMeans(n_clusters=k) # 建模 kmeans_temp = kmeans_model.fit_predict(data_matrix) # 计算点距离 # print(kmeans_temp) score = silhouette_score(data_matr
复制链接

扫一扫