一、k-means算法
算法描述
输入:簇的数目k;包含n个对象的数据集D。
输出:k个簇的集合。
方法:
- 从D中任意选择k个对象作为初始簇中心;
- repeat;
- 根据簇中对象的均值,将每个对象指派到最相似的簇;
- 更新簇均值,即计算每个簇中对象的均值;
- 计算准则函数;
- until准则函数不在发生变化
二、Machine Learning(Ng)算法笔记
算法主要思想:
1)首先根据你要聚类的个数(假设为k),选择k个中心u,可以挑选k个样本作为中心。
2)根据挑选出的k个中心,将每个样本(一共m个)贴上特定的标签。
3)根据新贴的标签,更新样本的中心。
三、word2vec中k-means实现