一、案例介绍
这是CDA数据分析网站的一个赛题,A公司希望发掘用户购买产品的行为习惯,建立产品精准营销模型,对有意向的客户进行精准营销,增加收入,减少开支。将通过混淆矩阵(Confusion matrix)来评价分类模型的准确率,准确率越高,说明正确预测出响应营销效果越好。
本次实战以官方公布的评分标准accuracy为目标进行参数调优与建模。又探索了在不同成本收益模型下,选择不同的模型评估指标,最终得到最高的潜在盈利预测。
附赛题网址:https://contest.cda.cn/info/id/6.
重要事情说三遍~
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站
想听我讲案例,请点这里,进入B站
二、框架
(一)赛题简介及数据预处理
(二)数据探索分析
(三)模型构建与评估
(四)预测与排名
(五)成本收益分析与模型重构
三、附部分代码及输出
(一)数据预处理(算法填充缺失值)
# 填充
cates=['用户地区', '性别', '使用累计时间','产品服务使用量', '是否使用信用卡付月费','是否为活跃用户']
x_cates=['产品使用分数', '年龄', '点数余额','估计薪资']
dummies_f7=[ region_features,sex_features,usetime_features,service_features,credict_features,active_features,fill_data[x_cates] ]
for i in range(6):
print(