kmeans改进 matlab,K-Means聚类之Matlab

最新推荐文章于 2023-04-19 10:28:15 发布

咦呀咦呀哟

最新推荐文章于 2023-04-19 10:28:15 发布

阅读量453

点赞数 1

文章标签： kmeans改进 matlab

[转自]：http://blog.sciencenet.cn/blog-41996-450513.html –基本是对Matlab Help中的翻译

[参考]：Pluskid之漫谈 Clustering (1): k-means

K-means聚类算法采用的是将N*P的矩阵X划分为K个类，使得类内对象之间的距离最大,而类之间的距离最小。

使用方法：

Idx=kmeans(X,K)

[Idx,C]=kmeans(X,K)

[Idx,C,sumD]=kmeans(X,K)

[Idx,C,sumD,D]=kmeans(X,K)

[…]=kmeans(…,’Param1’,Val1,’Param2’,Val2,…)

各输入输出参数介绍：

X N*P的数据矩阵

K 表示将X划分为几类，为整数

Idx N*1的向量，存储的是每个点的聚类标号

C K*P的矩阵，存储的是K个聚类质心位置

sumD 1*K的和向量，存储的是类间所有点与该类质心点距离之和

D N*K的矩阵，存储的是每个点与所有质心的距离

[…]=kmeans(…,’Param1′,Val1,’Param2′,Val2,…)

这其中的参数Param1、Param2等，主要可以设置为如下：

1. ‘Distance’(距离测度)

‘sqEuclidean’ 欧式距离(默认时，采用此距离方式)

‘cityblock’ 绝度误差和，又称：L1

‘cosine’ 针对向量

‘correlation’ 针对有时序关系的值

‘Hamming’ 只针对二进制数据

2. ‘Start’(初始质心位置选择方法)

‘sample’ 从X中随机选取K个质心点

‘uniform’ 根据X的分布范围均匀的随机生成K个质心

‘cluster’ 初始聚类阶段随机选择10%的X的子样本(此方法初始使用’sample’方法)

matrix 提供一K*P的矩阵，作为初始质心位置集合

3. ‘Replicates’(聚类重复次数) 整数

使用案例：

data=[

5.0 3.5 1.3 0.3 -1

5.5 2.6 4.4 1.2 0

6.7 3.1 5.6 2.4 1

5.0 3.3 1.4 0.2 -1

5.9 3.0 5.1 1.8 1

5.8 2.6 4.0 1.2 0];

[Idx,C,sumD,D]=kmeans(data,3,’dist’,’sqEuclidean’,’rep’,4)

运行结果：

Idx =

1

2

3

1

3

2

C =

5.0000 3.4000 1.3500 0.2500 -1.0000

5.6500 2.6000 4.2000 1.2000 0

6.3000 3.0500 5.3500 2.1000 1.0000

sumD =

0.0300

0.1250

0.6300

D =

0.0150 11.4525 25.5350

12.0950 0.0625 3.5550

29.6650 5.7525 0.3150

0.0150 10.7525 24.9650

21.4350 2.3925 0.3150

10.2050 0.0625 4.0850

matlab-kmeans函数注释

X = [randn(100,2)+ones(100,2);…

randn(100,2)-ones(100,2)]; 产生100个样本点，行指向每个样本，列是维变量值。

opts = statset(‘Display’,’final’);

[idx,ctrs] = kmeans(X,2,’Distance’,’city’,’Replicates’,5,’Options’,opts);

%返回参数意义：[IDX,C,sumd,D]=kmeans()

IDX:每个样本点所在的类别

C：所聚类别的中心点坐标位置k*p，k是所聚类别

sumd:每个类内各点到中心点的距离之和

D：每个点到各类中心点的距离n*k

Matlab聚类分析中kmeans函数运行结果，请教为什么？

k=5;

[IDX,C,sumd,D] =kmeans(SCORE(:,1:3),k);

我想把主成份分析后的结果SCORE(：，1：3)，大小为89*3，聚成5类，我的理解的运行结果应该是：

IDX是1~5的整数，表示归到了那一类；

C是每一类的质心位置，大小是5*3；

sumd是每一类中各点到质心的距离和，大小是1*5；

D是每个点到质心的位置，大小是89*1

在Jiawei Han的这篇文章中《Document Clustering Using Locality Preserving Indexing 》默认采用如下参数：

kmeans(U, k, ‘start’, ‘sample’, ‘replicates’, ’10’);

咦呀咦呀哟

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
kmeans改进 matlab,K-Means聚类之Matlab

[转自]：http://blog.sciencenet.cn/blog-41996-450513.html –基本是对Matlab Help中的翻译[参考]：Pluskid之漫谈 Clustering (1): k-meansK-means聚类算法采用的是将N*P的矩阵X划分为K个类，使得类内对象之间的距离最大,而类之间的距离最小。使用方法：Idx=kmeans(X,K)[Idx,C]=kmean...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。