Silhouettes：聚类结果衡量指标

最新推荐文章于 2022-02-24 00:11:57 发布

ASD991936157

最新推荐文章于 2022-02-24 00:11:57 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/ASD991936157/article/details/52080627

版权

这段代码展示了如何计算样本的轮廓系数以评估聚类结果。通过导入numpy、sklearn库，利用pairwise_distances计算距离，然后计算同一簇内的平均距离（intra_clust_dists）和不同簇间的平均距离（inter_clust_dists），最后计算并返回轮廓系数。

摘要由CSDN通过智能技术生成

import numpy as np
from sklearn import datasets
from sklearn.metrics import pairwise_distances
from sklearn.preprocessing import LabelEncoder


def silhouette_samples(X, labels, metric='euclidean', **kwds):
    le = LabelEncoder()
    labels = le.fit_transform(labels)
    unique_labels = le.classes_
    distances = pairwise_distances(X, metric=metric, **kwds)
    intra_clust_dists = np.ones(distances.shape[0], dtype=distances.dtype)
    inter_clust_dists = np.inf * intra_clust_dists
    for curr_label in unique_labels:
        mask = curr_label == labels
        current_distances = distances[mask]
        n_samples_curr_lab = np.sum(mask) - 1
        if n_samples_curr_lab != 0:
            intra_clust_dists[mask] = np.sum(current_distances[:, mask], axis=1) / n_samples_curr_lab
        for other_label in unique_labels:
            if other_label != curr_label:

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ASD991936157

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Silhouettes：聚类结果衡量指标

import numpy as npfrom sklearn import datasetsfrom sklearn.metrics import pairwise_distancesfrom sklearn.preprocessing import LabelEncoderdef silhouette_samples(X, labels, metric='euclidean', **
复制链接

扫一扫