文章目录
算法思维导图:
一、无监督算法:
1、聚类算法:Kmeans
Kmeans中心思想:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,直到质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。
优点:
1、算法原理简单、处理速度较快
2、当聚类是密集的,且类与类之间区别明显时,效果较好
缺点:
1、在K-means算法中,K是事先给定的,比较难确定
2、对孤立点比较敏感,噪声敏感(中心点易偏移)
3、结果不稳定,初始值的选定对结果有一些影响,结果不一定全局最优,只能保证局部最优(与k的个数及初选值有关)
4、空间复杂度o(N)