本章目标
- 关注非监督学习,如何弥合原始机器学习工作流在模型构建方面的缺口;
- 了解如何比较使用非监督学习开发的不同模型以认识其相对优势和相对不足;
- 对于非监督学习最重要的是,希望认识它生成的不同类型的结论解决的不同类型的问题,及其与监督学习的区别。
聚类
Kmeans
sklearn.cluster.KMeans
- n_clusters算法伊始选择centroid的个数最重要
- max_iter 最大迭代次数
- n_init 提供不同初始化方案的数量
local hill climbing algorithm 局部最优解