这一节是使用聚类算法来对公司客户价值进行判断和分析。
提到聚类算法,大家应该都会想到是K-means。这是比较简单和经典的一种聚类算法。
k-means聚类算法的原理比较简单,实现也容易,可以直接调用python的sklearn包中封装好的函数实现。
这部分主要记录如何将聚类算法与显示案例应用联系起来判断和分析。
对于这个项目的实现,在已知客户相关数据的情况下,需要发掘出忠实客户数据。实现的方法为:
1. 整理好相关数据,把非必要特征去除
2. 选择实现的算法
3. 构建模型
4. 绘图分析
关键在于第三步和第四步。
K-means聚类算法与分类算法都研究事物之间的划分,但是最大的区别在于,聚类是指在不确定类别的情况下对客户群体进行划分,而分类是已经有具体的类别标签。
K-mean算法的步骤具体为:<