K-means和ISODATA 算法 原理与实现
K-means算法原理:对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。如果用数据表达式表示,假设簇划分为(C1,C2,…Ck),则我们的目标是最小化平方误差E:其中μi是簇Ci的均值向量,有时也称为质心,表达式为: 一般步骤: 1.初始化。输入基因表达矩阵作为对象集X,输入指定聚类类数N,并在X中随机选取N个对象作为初始聚类中心。设定迭代中止条件,比如最大循环次数或者聚类中心收敛误差容限。2.进行迭代。根据相似度准则将
原创
2020-07-17 20:10:09 ·
1204 阅读 ·
0 评论