聚类分析-K-Means

K-Means算法也称为K-均值聚类算法,是一种广泛使用的聚类算法,也是其他聚类算法的基础

假定输入样本为S=X1,X2,…,Xm,则算法步骤为:
1, 选择初始的k个类别中心,例如k=2
2, 对于每个样本Xi,将其标记为距离类别中心最近的类别
3, 将每个类别中心更新为隶属该类别的所有样本的均值
4,重复第2步和第3步,直到类别中心的变化达到终止条件
终止条件一般有迭代次数,族中心变化率,最小平方误差MSE(Minimum Squared Error)等

其迭代过程如下:
在这里插入图片描述

K-Means的实现代码:
根据df表中所有数值型列名来实现对n条数据的聚类

df.columns
X=df[[表中所有数值型列名]]
X.info
#将所有X里的列数值标准化,统一量纲后存在变量Xstd里
from sklearn.preprocessing import StandardScaler
std=StandardScaler()
Xstd=std.fit_transform(X)
#导入KMeans库文件
from sklearn.cluster import KMeans
#确定聚类数量,例如聚成3类
est=KMeans(n-clusters=3, random_state=0)
#拟合预测,把结果(由0和1,2组成)存在res变量中
res=est.fit_predict(Xstd)
#计算每一类包含的数据个数
from collections import Counter
Counter(res)
#看具体哪些数据对应第0类,哪些数据对应第1类,哪些数据对应第2类。每类又有一些什么特征
df["预测分类”]=res
#用group by 作分类聚合
df.groupby("预测分类").mean().T
#取消显示时的科学计数法
np.set_printoptions(suppress)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
点云k-means聚类是一种应用于点云数据的聚类算法,可以通过将点云数据划分为不同的簇来实现数据的分类和分割。PCL(点云库)是一个用于点云处理的开源库,其中包含了用于点云k-means聚类的Python模块。 点云k-means聚类的过程如下:首先,选取合适数量(k)的初始聚类中心点。然后,将每个点与聚类中心点进行距离计算,并将其分配给离其最近的中心点所对应的聚类。接着,根据每个聚类中的点重新计算其聚类中心点。重复以上两个步骤,直到聚类中心点的位置不再变化或者达到预定的迭代次数为止。 使用PCL库的Python模块,在进行点云k-means聚类时,首先需要导入相关的模块和数据。然后,通过调用PCL库中的聚类算法函数,传入点云数据和所需的聚类数量k。接着,可以设置聚类算法的参数,如迭代次数、收敛阈值等。最后,调用聚类算法函数来执行点云k-means聚类,并获取聚类的结果。 在得到点云k-means聚类的结果后,可以对每个聚类进行进一步的操作,如可视化显示每个聚类的点云数据、计算每个聚类的质心或其他统计量等。此外,可以根据具体的需求调整聚类算法的参数,以获得更好的聚类效果。 总而言之,点云k-means聚类是一种有效的点云数据处理方法,可通过使用PCL库的Python模块来实现。该方法可以对点云数据进行分类和分割,从而对点云数据进行更深入的分析和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值