支持向量机实战电信运营商 -客户流失预警

最新推荐文章于 2021-11-30 10:06:07 发布

每天都要被自己菜醒

最新推荐文章于 2021-11-30 10:06:07 发布

阅读量570

点赞数

分类专栏：大数据文章标签：机器学习数据分析深度学习 python

本文链接：https://blog.csdn.net/qq_45531594/article/details/108475975

版权

本文探讨了在电信运营商客户流失预警问题中，如何使用支持向量机（SVM）和随机森林进行数据分析。通过加载数据、数据清洗、特征工程和模型建立，发现SVM在预测效果上表现出色。进一步通过随机森林提升模型精度，强调了通话频率作为关键指标的重要性，并注意到样本数据的不平衡问题。

摘要由CSDN通过智能技术生成

python 里面zip() 函数的用法
在这里插入图片描述

subplot2grid

在这里插入图片描述

分析与准备数据—开会与讨论

在这里插入图片描述

4.1.1 加载数据集

在这里插入图片描述
Step.1 通过pandas来导入csv：查看一下数据的基本情况，可以看到，整个数据集有3333条数据， 21个维度，最后一列是分类

import warnings
warnings.filterwarnings('ignore') #警告

from __future__ import division # 精确除法，“/”操作执行的是截断除法
import pandas as pd
import numpy as np

churn_df = pd.read_csv('churn.csv')
col_names = churn_df.columns.tolist() #所有的列展示出来

print("Column names:")
print(col_names)

Step.2 基本信息以及类型
在这里插入图片描述

to_show = col_names[:6] + col_names[-6:] #前6列和后6列

print("\nSample data:")
churn_df[to_show].head(6)

churn_df.info() #主要是看有没有缺失值

在这里插入图片描述

churn_df.describe() 
#describe() 可以返回具体的结果， 对于每一列。

#数量 平均值 标准差 25% 分位 50% 分位数 75% 分位数 最大值 很多时候你可以得到NA的数量和比例。

4.1.2 探索性数据分析

Step1.特征自己的信息

#特征自己的信息
#我们先来看一下流失比例， 以及关于打客户电话的个数分布

import matplotlib.pyplot as plt 
%matplotlib  inline 

fig = plt.figure()
fig.set(alpha = 0.3)  #设定图表颜色的alpha参数.
plt.subplot2grid( (1,2) ,(0,0) ) #图像几行几列，从0行0列开始

#取值的数量  false 远比true 要多
##把用户是否流失累加起来，流失的累加起来，没有流失的累加起来
churn_df['Churn?'].value_counts().plot(kind = 'bar')
plt.title(u"stat for churn") # 设置标题
plt.ylabel(u"number")  #流失与否的数量，一共3333行，没有流失的约占2700 ，流失的占500左右

plt.subplot2grid((1,2),(0,1))

#线性，柱状 ，折线，核密度图
#line bar barsh  kde
#客服电话数量
churn_df['CustServ Calls'].value_counts().plot(kind = 'bar')
plt.title(u"stat for cusServCalls") # 标题
plt.ylabel(u"number") #客户打1个客服电话的有1400个左右，客户.....总计加起来有3333个

在这里插入图片描述

import matplotlib.pyplot as plt
%matplotlib inline
fig = plt.figure()
fig.set(alpha=0.2)  # 设定图表颜色alpha参数

plt.subplot2grid((1,3),(0<

最低0.47元/天解锁文章

每天都要被自己菜醒

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
支持向量机实战电信运营商 -客户流失预警

python 里面zip() 函数的用法
复制链接

扫一扫

专栏目录

支持向量机 实战电信运营商 -客户流失预警

subplot2grid

分析与准备数据—开会与讨论

4.1.1 加载数据集

支持向量机实战电信运营商 -客户流失预警