k均值聚类手肘法怎么算matlab,KMeans聚类、肘部法则求最佳分类数

本文介绍了K-Means聚类算法的工作原理,强调了如何通过肘部法则确定最佳的类别数量。通过计算不同类别数量下的成本函数(即类内点到类中心的平均平方距离之和),找到成本函数下降最显著的转折点,以选择最优的类别数。此外,还展示了使用matplotlib绘制散点图和聚类中心点的示例。
摘要由CSDN通过智能技术生成

K-Means算法是一个重复移动类中心点的过程,把类的中心点,也称重心(centroids),移动到其包含成员的平

均位置,然后重新划分其内部成员。 是算法计算出的超参数,表示类的数量;K-Means可以自动分

配样本到不同的类,但是不能决定究竟要分几个类。 K-Means的参数是类的重心位置和其内部观测值的位置。与广义线性模型和决策树类似,K-Means参

数的最优解也是以成本函数最小化为目标。K-Means成本函数公式如下:

0818b9ca8b590ca3270a3433284dd417.png

uk是第k 个类的重心位置。成本函数是各个类畸变程度(distortions)之和。每个类的畸变程度等于该类重心与其内部成员位置距离的平方和。若类内部的成员彼此间越紧凑则类的畸变程度越小,反

之,若类内部的成员彼此间越分散则类的畸变程度越大。求解成本函数最小化的参数就是一个重复配

置每个类包含的观测值,并不断移动类重心的过程。

#-*- coding:utf-8 -*-

import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

from scipy.spatial.distance import cdist

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值