matlab中kmeans使用
matlab中kmeans使用
英文实在太难看懂了,翻译一下
k-means简介
后续有空就加上吧
matlab使用
[IDX, C] = KMEANS(X, K);返回聚类下标IDX,聚类中心坐标C
[IDX, C, SUMD] = KMEANS(X, K); 返回聚类内的点到中心的距离之和的K×1 向量 sumD.
[IDX, C, SUMD, D] = KMEANS(X, K) ;返回每个点到聚类中心的距离 N×K矩阵D.
[ … ] = KMEANS(…, ‘PARAM1’,val1, ‘PARAM2’,val2, …) 其他参数和选值如下:
-
‘Distance’ ——描述距离的方式,可选参数值如下:
‘sqeuclidean’ : 默认值,欧式距离
‘cityblock’ : 绝对差的和,也就是L1距离
‘cosine’ : 1减去点之间夹角的余弦值(作为向量处理)
‘correlation’ : 1减去点之间的样本相关性(作为值的序列处理)
‘hamming’ 不同位的百分比(只适用于二进制数据) -
‘Start’——选择初始聚类中心的方法,可选参数值如下:
“plus”-默认值。根据K-means++算法从X中选择K个观测值:从X中随机均匀地选择第一个聚类中心,然后从剩余的数据点随机选择每个后续的聚类中心,其概率与该点最近的现有聚类中心的距离成正比。
“sample”-从X中随机选择K个观测值。
“uniform”-从X的范围内随机均匀地选择K个点。对于Hamming距离无效。
“cluster”-对X的随机10%子样本执行初步聚类阶段。这个初步阶段本身使用“sample”初始化。(这是mini kmeans用到的吗?)
matrix-起始位置的K×P矩阵。在这种情况下,可以设置矩阵,KMEANS从矩阵的第一个维度推断K。您还可以提供一个三维数组,这意味着从数组的第三维度“复制”的值。
4. ‘Replicates’ :重复次数
5…