![374e49853f430edbd2dea34dff08fde0.png](https://img-blog.csdnimg.cn/img_convert/374e49853f430edbd2dea34dff08fde0.png)
中国的古语有云,“物以类聚,人以群分”
一、前言
K均值KMeans属于无监督学习聚类算法中最简单的一种。
聚类 clustering
,属于无监督学习中的分类算法。无监督学习 unsupervised learning
,指样本数据于没有y或者没有标签(label/target)数据,也就是只有一堆的自变量Xs(特征变量),然后通过这些自变量来对样本进行分类。无监督学习算法的目标通常是探索和发现数据隐藏的结构和规律。聚类
算法还可以用于降维,特征和数据压缩- 其它典型聚类算法:DBSCAN,光谱聚类,层次聚类
聚类算法的现实应用:根据消费者的一系列特征的取值,归类到不同的组别。比如某些组别购买力强且对价格不敏感,某些组别购买的商品类型多且时间相近。基于这些顾客画像的描绘,就可以制定相应的广告策略,提高广告投放的精准程度。
KMeans算法的2个关键概念:
- 簇:通俗点叫一堆,一个簇就相当于一个类。KMea