K-means聚类

最新推荐文章于 2024-08-30 12:42:13 发布

JJJJJackson、

最新推荐文章于 2024-08-30 12:42:13 发布

阅读量190

点赞数

分类专栏：数学建模文章标签： python sklearn

本文链接：https://blog.csdn.net/YKLCY_1334/article/details/120089404

版权

数学建模专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本文介绍了K-means聚类算法的应用，通过Python的sklearn库进行实现。内容包括问题背景、所需导入的库、聚类过程中的中心点坐标及分类结果，并讨论了评估聚类效果的轮廓系数。

摘要由CSDN通过智能技术生成

K-means聚类

文章目录

K-means聚类

问题背景

用于解决以下问题：有n个点，每个点都有m个特征值（一般不会太多），将其分为k类。

要求：类与类之间的差距尽可能大，类之间各点的差距尽可能小。这一目标我们使用轮廓系数来衡量。

下面我将展示如何调用python中的sklearn快速地完成聚类算法。

需要导入的库

from sklearn.metrics import silhouette_score
from Bio.Cluster import kcluster
from sklearn.cluster import KMeans

中心点坐标以及分类结果

# 这里的X是原始点坐标，n行m列，表示有n个点，每个点的特征值数量为m个
# 这里n_clusters=4表示分为4类
K = KMeans(n_clusters=4, random_state=0)
# 这句话必不可少
y_pred = K.fit_predict(X)
# 中心点
center = K.cluster_centers_
print(center)
# 分类结果
label=K.labels_
print(label)

轮廓系数

# 下面这一系列过程完成了分别求出分3类到15类情况下轮廓系数的大小（最大的为最佳方案）
coef = []

x = range(3, 15)
for clusters in x:
    print(clusters)
    clusterid, error, nfound = kcluster(X, clusters, dist='u', npass=100)
    silhouette_avg = silhouette_score(X, clusterid, metric='cosine')
    coef.append(silhouette_avg)

e = [i + 3 for i, j in enumerate(coef) if j == max(coef)]
print(e)
print(coef)

JJJJJackson、

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K-means聚类

K-means聚类文章目录K-means聚类问题背景需要导入的库中心点坐标以及分类结果轮廓系数问题背景用于解决以下问题：有n个点，每个点都有m个特征值（一般不会太多），将其分为k类。要求：类与类之间的差距尽可能大，类之间各点的差距尽可能小。这一目标我们使用轮廓系数来衡量。下面我将展示如何调用python中的sklearn快速地完成聚类算法。需要导入的库from sklearn.metrics import silhouette_scorefrom Bio.Cluster import kcl
复制链接

扫一扫

专栏目录