k-means聚类(matlab)_【算法推荐】kmeans++

自Lloyd提出k-means算法以来, 虽然它没有提供准确性保证,但它的简单性和速度在实践中很有吸引力。因此, k-means算法得到了广泛的应用。本文介绍了k-means++算法,k-means++算法由Arthur 和 Vassilvitskii提出,对标准的k-means算法的初始过程进行改进,尽管简单,但却很有效。

一、k-means算法

k-means算法在上篇文章中已经推送,可以参考【数据挖掘笔记】K-均值算法及其拓展。

f88a457f408c9dfb6c17ea895a4be4e9.png

二、k-means++算法

k-means++算法流程如下:

98f6332c7fb6e45ee1292cc46af3cf9c.png

e2b671f5d5045b82b592ffe97c728339.png

k-means++算法通俗地讲,流程如下:
  • 任意从n个数据对象中选取一个初始簇中心点c_1;

  • 根据概率公式计算每一个数据对象离它最近的中心点之间的距离D(x)及其被选中为下一个中心点的概率:

336a23ad4603a09f306ae0732e602588.png

  • 选择发生概率最大的数据对象作为下一个中心点,重复上述操作,直到找到k个中心点为止。

    <
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
k-means聚类是一种常用的无监督学习算法,可用于将具有相似特征的数据样本分组。 在Matlabk-means聚类算法可以应用于三维数据。首先,将待聚类的数据导入Matlab,并确保数据的维度正确。然后,可以使用k-means函数进行聚类分析。 k-means函数的一般语法如下: [idx, C] = kmeans(data, k) 其,data是一个n×m的矩阵,n表示样本数量,m表示特征维度;k是预先指定的聚类数量;idx是一个n×1的向量,表示每个样本所属的聚类的索引;C是一个k×m的矩阵,表示每个聚类心点的坐标。 在三维数据聚类,data的每一行就代表一个三维数据点的坐标。通过执行k-means聚类算法,输出的idx向量将对应于每个数据点所属的聚类。 下面是一个简单的示例代码,演示了如何使用k-means函数对三维数据进行聚类: ``` % 生成随机的三维数据 data = rand(100, 3); % 指定聚类数量为k k = 3; % 执行k-means聚类 [idx, C] = kmeans(data, k); % 可视化结果 figure; scatter3(data(:, 1), data(:, 2), data(:, 3), 50, idx, 'filled'); hold on; scatter3(C(:, 1), C(:, 2), C(:, 3), 200, (1:k)', 'filled'); xlabel('X'); ylabel('Y'); zlabel('Z'); title('k-means聚类结果'); ``` 在上述示例,首先生成了一个100×3的随机数据矩阵,然后将聚类数量指定为3。通过执行k-means聚类算法,得到的idx向量将指示每个数据点所属的聚类索引。最后,将原始数据和聚类心点可视化展示出来。 通过以上方法,可以在Matlab进行k-means聚类算法的三维数据分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值