基于数据kmeans_data分析聚类画图使用sc轮廓系数作为评价指标

最新推荐文章于 2024-07-19 08:15:00 发布

liovo先生

最新推荐文章于 2024-07-19 08:15:00 发布

阅读量1.7k

点赞数

分类专栏：机器学习文章标签： python 机器学习聚类聚类算法

本文链接：https://blog.csdn.net/weixin_46066900/article/details/106250309

版权

本文介绍了如何使用Python实现K-Means聚类算法，并通过sklearn库进行操作。讨论了迭代停止的条件，展示了使用SK系数（Silhouette Coefficient）作为聚类效果评价指标的过程。结果显示，SC轮廓系数为0.6558，用于评估模型的聚类质量。

摘要由CSDN通过智能技术生成

1、基于python实现K-Means
在这里插入图片描述
迭代停止的条件：
a、簇中a心相较b上一次迭代未改变 ≈ 所有样本点较上一次迭代未改变划分类别
b、达到人为设置的最大迭代次数
2、基于sklearn实现K-Means
语法：from sklearn.cluster imports KMeans
model = KMeans(n_clusters=k)
model.fit(data)
y_pred = model.predict(data)
属性：
cluster_centers_:簇中心【数组】
centroids = model.cluster_centers_
3、调用skleanr中的K-Means算法聚类得到结果；
4、使用评价指标“SC系数(Silhouette Cofficient)”评价模型；
5、绘制出最终聚类结果的簇

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.metrics import calinski_harabasz_score


def load_data(file_path):
    data = pd.read_table(file_path, sep='\t', header=None)
    return data


def