机器学习算法 - k-means Clustering K均值聚类

本文详细介绍了K-means聚类算法,包括其相关定义、数学描述、算法步骤,以及Python实现。讨论了算法局限性,如局部最优解问题和K的选择对结果的影响。通过对数据点进行迭代和距离计算,将数据点分配到最近的聚类中心,从而完成聚类过程。
摘要由CSDN通过智能技术生成

k-means Clustering即K均值聚类算法是一类运用广泛的聚类算法。

相关定义

聚类

聚类是指把对象划分为多个组或者“聚簇”,从而使得同组对象之间比较相似,而不同组对象之间差异较大。

因为聚类过程中,并没有输入和待聚类对象之间的联系信息,因此聚类通常被看做无监督学习。

k-means算法是一种简单的聚类算法,主要通过迭代来将数据集分类。

算法描述

数学描述

算法的输入对象可以看做是 d 维向量空间的一些点,即对集合 D={xi|i=1,2,3,...,n} 进行聚类,并且其中 xiRd 表示第i个数据点。而k-means聚类则是对D中的所有数据点进行处理,聚类中心可以表示为 C={

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值