为什么做客户流失模型分析?
1、企业再发展新用户成本很高
2、客户的流失会给企业造成很大的损失,一个老客户的价值相当于三个新客户的价值
3、客户的流失不仅给企业带来经济上的损失,同时也给企业的名誉和口碑造成伤害
三步快速客户流失模型分析!
1、使用Python分析并处理客户流失数据集
2、选用逻辑斯蒂回归(logistic regression)简单建模
3、最后使用拟合模型来进行客户流失预测
案例参考Clinton W. Brownley《Foundations for Analytics with Python》
数据地址https://raw.githubusercontent.com/EricChiang/churn/master/data/churn.csv
处理客户流失数据集
客户流失数据集是一个记录电信公司现有的和曾经的客户的数据文件,有1个输出变量和20个输入变量。
输出变量是一个布尔型变量,表示客户是否已经流失。
输入变量是客户的电话计划和通话行为的特征,包括状态、账户时间、区号、电话号码、是否有国际通话计划、是否有语音信箱、语音信箱消息数量、白天通话时长、白天通话次数、白天通话费用、傍晚通话时长、傍晚通话次数、傍晚通话费用、夜间通话时长、夜间通话次数、夜间通话费用、国际通话时长、国际通话次数、国际通话费用和客户服务通话次数。
创建一个新列churn01,并使用numpy的where函数根据churn这一列中的值用1或0来填充它。churn这一列中的值不是True就是False,所以如果churn中的值是True,