k均值聚类手肘法怎么算matlab,KMeans聚类、肘部法则求最佳分类数

最新推荐文章于 2024-06-16 13:01:17 发布

啊准语录

最新推荐文章于 2024-06-16 13:01:17 发布

阅读量1.8k

点赞数

文章标签： k均值聚类手肘法怎么算matlab

本文介绍了K-Means聚类算法的工作原理，强调了如何通过肘部法则确定最佳的类别数量。通过计算不同类别数量下的成本函数（即类内点到类中心的平均平方距离之和），找到成本函数下降最显著的转折点，以选择最优的类别数。此外，还展示了使用matplotlib绘制散点图和聚类中心点的示例。

摘要由CSDN通过智能技术生成

K-Means算法是一个重复移动类中心点的过程，把类的中心点，也称重心(centroids)，移动到其包含成员的平

均位置，然后重新划分其内部成员。是算法计算出的超参数，表示类的数量；K-Means可以自动分

配样本到不同的类，但是不能决定究竟要分几个类。 K-Means的参数是类的重心位置和其内部观测值的位置。与广义线性模型和决策树类似，K-Means参

数的最优解也是以成本函数最小化为目标。K-Means成本函数公式如下：

uk是第k 个类的重心位置。成本函数是各个类畸变程度(distortions)之和。每个类的畸变程度等于该类重心与其内部成员位置距离的平方和。若类内部的成员彼此间越紧凑则类的畸变程度越小，反

之，若类内部的成员彼此间越分散则类的畸变程度越大。求解成本函数最小化的参数就是一个重复配

置每个类包含的观测值，并不断移动类重心的过程。

#-*- coding:utf-8 -*-

import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from scipy.spatial.distance import cdist

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。