1 数据介绍
jamesrawlins1000/Telecom-CDR-Dataset- (github.com)
- 使用这个CDR(通话详单记录)数据对客户进行分类和测量满意度。
- 数据集包含101,174个客户的17个属性,并指示客户是否流失。流失客户的总数为8,830人。
- 数据集包含以下变量:州、帐户长度、电话号码、国际计划、邮件计划、语音邮件数量、总白天通话时间、总白天通话次数、总白天费用、总晚间通话时间、总晚间通话次数、总晚间费用、总夜间通话时间、总夜间通话次数、总夜间费用、总国际通话时间、总短信费用、总国际通话次数、总国际通话费用和流失情况。
- 数据集中还包含许多数据字段,包括主叫号码、被叫号码以及通话的日期和时间。【这个我暂时没有找到】
2 数据处理
import pandas as pd
pd.read_csv('Telecom-CDR-Dataset--master/Call Details-Data.csv')