K-means
红酒数据集(Wine Data Set)http://archive.ics.uci.edu/ml/datasets/Wine
要求:
1.编程实现K-means算法,并在红酒数据集上运行。
2.设置不同K值,不同初始中心,在红酒数据集上进行实验比较。
3.分析k-means的优缺点,并对其中一个或几个缺点进行改进。
这个我是有借鉴哒!把原博po在这里:http://blog.csdn.net/llp1992/article/details/45095935
实现过程:
1. 首先利用importdata函数将数据集读入并存储到到一个178*13的矩阵a中,把数据集中的第一列分类去掉了,因为在聚类时用不到。由于13种属性的取值相差太大,有的值很大,有的值很小,如最后一列属性中,其中某个属性值很大,但是它在自己所在的属性列中占的权重不一定大。所以避免不同属性值相差悬殊在分类时产生不好的影响,将每个样本的每个属性都单位化。即每个属性值在自己所在的属性列中单位化。
2.