三大运营商电信、联通、移动,都想扩大自己的客户群体。据研究,获取新客户所需的成本远高于保留现有客户的成本。因此为了满足在激烈竞争中的优势,提前预测出用户是否会流失,采取保留措施成为一大挑战。之前已经探索了电信流失用户画像,本文和你一起对电信用户进行流失预测。
文章目录
一、数据读取与分析
1 数据集介绍
首先介绍一下数据集,它总共包含了7043个用户的信息。每行存储一个用户的样本,每条样本包含21条属性,由用户基本信息、开通业务信息、签署合约信息、目标变量组成,具体如下:
变量名 描述 数据类型 所属特征群或标签
customerID 客户ID 字符串 基本信息
gender 性别 字符串 基本信息
SeniorCitizen 是否为老年人 整型 基本信息
Partner 是否有配偶 字符串 基本信息
Dependents 是否有家属 字符串 基本信息
tenure 入网月数 整型 基本信息
PhoneService 是否开通电话业务 字符串 开通业务信息
MultipleLines 是否开通多线业务 字符串 开通业务信息
InternetService 是否开通互联网业务 字符串 开通业务信息
OnlineSecurity 是否开通在线安全业务 字符串 开通业务信息
OnlineBackup 是否开通在线备份业务 字符串 开通业务信息
DeviceProtection 是否开通设备保护业务 字符串 开通业务信息
TechSupport 是否开通技术支持业务 字符串 开通业务信息
StreamingTV 是否开通网络电视业务 字符串 开通业务信息
StreamingMovies 是否开通网络电影业务 字符串 开通业务信息
Contract 合约期限 字符串 签署合约信息
PaperlessBilling 是否采用电子结算 字符串 签署合约信息
PaymentMethod 付款方