聚类算法的步骤(k-means)
{
c
(
i
)
来
存
储
与
第
i
个
实
例
(
x
i
)
数
据
最
近
的
聚
类
中
心
的
索
引
μ
k
聚类中心
μ
c
(
i
)
代
表
与
(
x
i
)
最
近
的
聚
类
中
心
点
。
_{\begin{cases} c^{\left( i \right)}来存储与\text{第}i个实例\left( x_i \right) 数据最近的聚类中心的索引\\ \mu _k\,\,\text{聚类中心}\\ \mu _{c^{\left( i \right)}}代表与\left( x_i \right) 最近的聚类中心点。\\ \end{cases}}
{c(i)来存储与第i个实例(xi)数据最近的聚类中心的索引μk聚类中心μc(i)代表与(xi)最近的聚类中心点。
目标是最小化代价函数:
聚类分两步:
‘簇分配’:把每个点分配到离他最近的中心
实际上是在最小化代价函数,保持最近
‘更新中心’:更新每一步的中心
迭代多次确定样本
K小于等于总样本数,
初始状态:随机选取
执行100次kmeans,计算每次的畸变函数,选取代价最小的
肘部法则
改变K,计算每次的代价函数,