聚类模型-原型聚类-KMeans

本文介绍了聚类模型中的KMeans算法,详细阐述了KMeans的类表示、失真函数定义以及算法流程,并对比了与模糊C均值聚类的区别。KMeans算法存在对初始值敏感、需要预设聚类数量等问题,适用于基于距离度量的聚类场景。
摘要由CSDN通过智能技术生成

聚类模型

1、层次聚类
2、原型聚类-K-means
3、模型聚类-GMM
4、EM算法-LDA主题模型
5、密度聚类-DBSCAN
6、图聚类-谱聚类

二、原型聚类-KMeans

​ KMeans的类表示是聚类中心点,以点 xi x i 来表示类,相似性度量同样可以采用常用的距离度量。根据类紧致性准则定义失真函数为所有样本点到该样本所在类中心的失真程度和最小。

J(c)=i=1m||x(i)c(i)j||2,i=1,2..m,j=1,2..k J ( c ) = ∑ i = 1 m | | x ( i ) − c j ( i ) | | 2 , i = 1 , 2.. m , j = 1 , 2.. k

其中 c(i)j c j ( i ) 表示第 i i 个样本所属的类。可以看出Kmeans算法只考虑了类内相似性,没有考虑类间相似性。对于Kmeans算法的求解采用EM算法,先假设类中心 c 1 1 , c 2 1 , . . , c k 1 ,然后根据相似性度量来划分所有样本点到 k k 类中(Kmeans是一种硬划分),根据划分后的样本点重新更新 k 类的类中心 c21,c22,..,c2k c 1 2 , c 2 2 , . . , c k 2 ,不断的迭代至稳定(类中心不再变化)。

KMeans算法流程:

1)随机初始化类中心

OpenCV中的kmeans聚类算法是一种常用的数据聚类算法,它可以将数据集划分为指定数量的类别。该算法在图像处理中常用于图像分割操作,也可以用于数据挖掘中的数据预处理。\[1\] 在OpenCV中,kmeans函数的原型为: ```cpp double cv::kmeans(InputArray data, int K, OutputArray bestLabels, TermCriteria criteria, int attempts, int flags, OutputArray centers) ``` 其中,参数说明如下: - data:表示需要被聚类的原始数据集合,每一行表示一个数据样本,每一列表示一个属性。数据集合的类型是Mat类型。 - K:表示分类的数目,常用的是K=2表示二分类。 - bestLabels:表示计算之后各个数据点的最终的分类索引,是一个INT类型的Mat对象。 - criteria:表示算法迭代终止条件,可以是迭代次数的限制条件或者指定的精度阈值。 - attempts:表示运行kmeans的次数,取结果最好的那次聚类为最终的聚类,一般进行2至3次尝试。 - flags:表示聚类初始化的条件,有三种取值情况,分别是随机选取初始化中心点、使用某种算法确定初始聚类点、使用用户自定义的初始点。 - centers:表示输出的每个分类的中心点数据。 通过调用OpenCV中的kmeans函数,可以对给定的数据集进行聚类操作,并得到每个数据点的分类结果和每个分类的中心点数据。\[2\]\[3\] #### 引用[.reference_title] - *1* [Opencv图像分割之K-means聚类算法](https://blog.csdn.net/linqianbi/article/details/79131056)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Opencv 关于Kmeans算法](https://blog.csdn.net/qq_45445740/article/details/103114328)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值