kmeans matlab 离散度_K-means之matlab实现

最新推荐文章于 2021-03-19 15:00:33 发布

weixin_39894104

最新推荐文章于 2021-03-19 15:00:33 发布

阅读量322

点赞数

文章标签： kmeans matlab 离散度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39894104/article/details/111786272

版权

本文通过Matlab详细介绍了K-means聚类算法的实现过程，包括初始化簇心、确定样本所属簇及更新簇心等关键步骤。通过实例展示了数据的可视化和迭代过程，探讨了算法对初始簇心选择的敏感性，并提出了两种改进方法：随机初始化簇心和在线K-means（随机梯度下降法）。

摘要由CSDN通过智能技术生成

引入

作为练手，不妨用matlab实现K-means

要解决的问题：n个D维数据进行聚类(无监督)，找到合适的簇心。

这里仅考虑最简单的情况，数据维度D=2，预先知道簇心数目K(K=4)

理论步骤

关键步骤：

(1)根据K个簇心(clusters，下标从1到K)，确定每个样本数据Di(D为所有数据整体，Di为某个数据，i=1...n)所属簇，即欧氏距离最近的那个。

簇心编号:

c_i = arg min_{j} {D_i - clusters_j}，即使得欧氏距离最近的那个j

(2) 更新簇心：所属簇编号c_i相同的样本数据D_i的元素们，用他们均值来替代原有簇心(D维向量均值)

代码

% my_kmeans

% By Chris, zchrissirhcz@gmail.com

% 2016年9月30日 19:13:43

% 簇心数目k

K = 4;

% 准备数据，假设是2维的,80条数据，从data.txt中读取

%data = zeros(100, 2);

load 'data.txt'; % 直接存储到data变量中

x = data(:,1);

y = data(:,2);

% 绘制数据，2维散点图

% x,y: 要绘制的数据点 20:散点大小相同，均为20 'blue':散点颜色为蓝色

s = scatter(x, y, 20, 'blue');

title('原始数据：蓝圈；初始簇心：红点');

% 初始化簇心

sample_num = size(data, 1); % 样本数量

sample_dimension = size(data, 2); % 每个样本特征维度

% 暂且手动指定簇心初始位置

clusters = zeros(K, sample_dimension);

clusters(1,:) = [-3,1];

clusters(2,:) = [2,4];

clusters(3,:) = [-1,-0.5];

clusters(4,:) = [2,-3];

hold on; % 在上次绘图(散点图)基础上，准备下次绘图

% 绘制初始簇心

scatter(clusters(:,1), clusters(:,2), 'red', 'filled'); % 实心圆点，表示簇心初始位置

c = zeros(sample_num, 1); % 每个样本所属簇的编号

PRECISION = 0.0001;

iter = 100; % 假定最多迭代100次

for i=1:iter

% 遍历所有样本数据，确定所属簇。公式1

for j=1:sample_num

%t = arrayfun(

最低0.47元/天解锁文章

weixin_39894104

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。