电信用户分析

最新推荐文章于 2022-12-28 20:41:02 发布

VIP文章 linhy_951206

最新推荐文章于 2022-12-28 20:41:02 发布

阅读量4.4k

点赞数 3

本文链接：https://blog.csdn.net/linhy_951206/article/details/106547928

版权

变量说明

Customer_ID：用户编号
Gender：性别
Age：年龄
L_O_S：在网时长
Tariff：话费类型/话费方案
Handset：手机品牌
Peak_calls：高峰时期电话数
Peak_mins：高峰时期电话时长
OffPeak_calls：低谷时期电话数
OffPeak_mins：低谷时期电话时长
Weekend_calls：周末电话数
Weekend_mins：周末电话时长
International_mins：国际电话时长
Nat_call_cost：国内电话费用
month：月份

背景与目标

运营商能够将客户很好地进行分层是为客户推出差异化的服务的基础，好的用户分析也是提升用户体验的前提。本文通过分析电信客户的相关数据（客户信息与客户通话数据），以期（1）了解客户特征，（2）并通过Kmeans聚类分析对客户进行聚类。

导入数据

import pandas as pd
# 导入数据
# 用户电话情况
custcall = pd.read_csv('C:\\Users\\lin\\Desktop\\custcall.csv',sep = ',')
# 用户信息
custinfo = pd.read_csv('C:\\Users\\lin\\Desktop\\custinfo.csv',sep = ',')

查看数据

print(custcall.shape)
custcall.head()

返回结果：
在这里插入图片描述

print(custinfo.shape)
custinfo.head()

返回结果：
在这里插入图片描述

1 数据清洗与整理

# 求每个用户各指标的平均值
custcall_avg = custcall.groupby(by = ['Customer_ID']).mean()

# month 的均值为同一值，故剔除 ‘month’
del custcall_avg['month']

# 合并数据集
cust = pd.merge(custinfo,custcall_avg,left_on = 'Customer_ID',right_index = True,how = 'inner')

# 查看Customer_ID是否有重复值
print(cust['Customer_ID'].duplicated().sum())

# 将Customer_ID设为索引
cust = cust.set_index(keys = ['Customer_ID'])
cust.head()

返回结果：
在这里插入图片描述

# 查看cust的形状并将其导出
print(cust.shape)
print(cust.columns.to_list())
cust.to_excel('C:\\User

最低0.47元/天解锁文章

linhy_951206

关注

3
点赞
踩
39

收藏

觉得还不错? 一键收藏
6
评论
电信用户分析

分类变量分布影响国内电话费用的因素手机型号矩阵分析套餐矩阵分析
复制链接

扫一扫

电信用户分析

变量说明

背景与目标

导入数据

查看数据

1 数据清洗与整理

“相关推荐”对你有帮助么？