【案例背景】
本案例收集了某电信行业客户数据,主要包含:在网月数、年龄、婚姻状况、现地址居住时间、教育程度、工作状态、性别、租设备、IP电话、无线电话、本月话费、语音信箱、网络、来电显示、呼叫等待、呼叫转移、流失状态等字段数据,一共600条数据。
数据源介绍
数据源中在网月数是到数据收集时间为止的在网月数。
这里用户流失状态判断是根据用户在近2个月是否还在使用手机号码为准。
【分析目的】
根据数据分学习客户特征,并根据客户的这些特征对客户是否会流失进行预测。
数据分析步骤:
数据预处理
1、描述性统计分析:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200905143307828.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3RpZ2VybmVzcw==,size_16,color_FFFFFF,t_70#pic_center)