航空公司客户价值分析(下)

本文利用K-Means算法对航空公司客户数据进行聚类分析,通过SSE手肘法确定k值,揭示不同客户群体特征。结果表明,客户分为五类:低价值、高价值、重要发展、一般挽留和一般发展客户,为企业提供客户价值评估与策略制定依据。
摘要由CSDN通过智能技术生成

模型训练

将之前处理好的数据拿来就进行模型训练,这里用的聚类算法为K-Means算法。K-Means算法主要就在于k=n_cluster参数的确定上面,到底是将k确定为几能进行更好的分类了。这里我采用了SSE手肘法来确定k值,SSE值代表了每一个数据点离聚类中心的距离的评分,即为误差平方。当k小于真实聚类数时,随着k增大数据之间的聚合度会增加,SSE下降幅度会很大,当k快达到真实聚类值时,SSE下降幅度会变平稳,就想一个手肘的形状,肘点即为最优k值,相关代码如下:

import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
input_file = '../tmp/std2.xls'
data = pd.read_excel(input_file)
SSE = []
for k in range(1,9):
    estimator = KMeans(n_clusters=k)
    estimator.fit(data)
    SSE.append(estimator.inertia_)#样本到最近的聚类中心的距离平方之和
X = range(1,9)
plt.xlabel('k')
plt.ylabel('SSE')
plt.plot(X,SSE,'o-')
plt.show()

结果如下:
在这里插入图片描述
从图中可以看出k的取值应该在4,5之间,这只有通过验证来确定到底是4还是5了,

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值