非监督学习:聚类、降维
聚类:K-means
1.随意画出聚类中心
2.分配
3.优化
连接集群中心,画等距垂直于两集群连线的线
优化:移动中心
再分配,再优化········直至两个类的正确中心位置
很有意思的k-means可视化工具 http://www.naftaliharris.com/blog/visualizing-k-means-clustering/
聚类算法 http://scikit-learn.org/stable/modules/clustering.html
k-means http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
使用k-means 一开始就要确定聚类数量,工作原理各点之间的距离
n_clusters 聚类数量,默认8
max_iter 最大迭代数
n_init 控制算法的初始化次数(????)
k-means局限性:对于一个固定的数据集,一个固定数量的簇中心,预测出的结果是不同的(初始聚类中心的位置决定)