一、k均值聚类算法
1.K-‐means算法
算法实现过程:
随机初始化K个聚类中心
几个类不是分离的,算法怎么做?举例,衣服大小怎么分:
2.K均值聚类算法的优化目标
3.随机初始化
局部最优的问题:
4.选择聚类的个数
选择一个临界点:
比如衣服尺寸的分类:
二、维度下降
目的:
①数据压缩
②数据的可视化(对数据的分析更加直观)
主成分分析(Principal Component Analysis–PCA)
问题:
算法:
数据预处理:
算法过程:
算法总结:
对被压缩过的数据表示进行重建:
选择主成分的数目
PCA应用的建议: