支持向量机 实战电信运营商 -客户流失预警

本文探讨了在电信运营商客户流失预警问题中,如何使用支持向量机(SVM)和随机森林进行数据分析。通过加载数据、数据清洗、特征工程和模型建立,发现SVM在预测效果上表现出色。进一步通过随机森林提升模型精度,强调了通话频率作为关键指标的重要性,并注意到样本数据的不平衡问题。
摘要由CSDN通过智能技术生成

python 里面zip() 函数的用法
在这里插入图片描述

subplot2grid

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

分析与准备数据—开会与讨论

在这里插入图片描述

4.1.1 加载数据集

在这里插入图片描述
Step.1 通过pandas来导入csv:查看一下数据的基本情况,可以看到, 整个数据集有3333条数据, 21个维度, 最后一列是分类

import warnings
warnings.filterwarnings('ignore') #警告

from __future__ import division # 精确除法,“/”操作执行的是截断除法
import pandas as pd
import numpy as np

churn_df = pd.read_csv('churn.csv')
col_names = churn_df.columns.tolist() #所有的列展示出来

print("Column names:")
print(col_names)


Step.2 基本信息以及类型
在这里插入图片描述

to_show = col_names[:6] + col_names[-6:] #前6列和后6列

print("\nSample data:")
churn_df[to_show].head(6)
churn_df.info() #主要是看有没有缺失值

在这里插入图片描述
在这里插入图片描述

churn_df.describe() 
#describe() 可以返回具体的结果, 对于每一列。

#数量 平均值 标准差 25% 分位 50% 分位数 75% 分位数 最大值 很多时候你可以得到NA的数量和比例。

4.1.2 探索性数据分析

  1. Step1.特征自己的信息
#特征自己的信息
#我们先来看一下流失比例, 以及关于打客户电话的个数分布

import matplotlib.pyplot as plt 
%matplotlib  inline 

fig = plt.figure()
fig.set(alpha = 0.3)  #设定图表颜色的alpha参数.
plt.subplot2grid( (1,2) ,(0,0) ) #图像几行几列,从0行0列开始

#取值的数量  false 远比true 要多
##把用户是否流失累加起来,流失的累加起来,没有流失的累加起来
churn_df['Churn?'].value_counts().plot(kind = 'bar')
plt.title(u"stat for churn") # 设置标题
plt.ylabel(u"number")  #流失与否的数量,一共3333行,没有流失的约占2700 ,流失的占500左右

plt.subplot2grid((1,2),(0,1))

#线性,柱状 ,折线,核密度图
#line bar barsh  kde
#客服电话数量
churn_df['CustServ Calls'].value_counts().plot(kind = 'bar')
plt.title(u"stat for cusServCalls") # 标题
plt.ylabel(u"number") #客户打1个客服电话的有1400个左右,客户.....总计加起来有3333个 

在这里插入图片描述
在这里插入图片描述

import matplotlib.pyplot as plt
%matplotlib inline
fig = plt.figure()
fig.set(alpha=0.2)  # 设定图表颜色alpha参数

plt.subplot2grid((1,3),(0<
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值