本练习利用决策树算法对电信离网用户流失数据建立二分类模型(离网、在网)。由于特征较多,借助相关性分析筛选删除对标签影响小的特征。部分特征做离散化处理,以提高模型稳定性。建立模型后,利用网格搜索和混淆矩阵方法输出最佳参数组合。最后,保存模型,并调用模型做分类预测。
一、读取数据
二、探索数据
三、特征筛选
四、模型构建
五、模型评估
六、决策树
七、模型保存与读取
本练习利用决策树算法对电信离网用户流失数据建立二分类模型(离网、在网)。由于特征较多,借助相关性分析筛选删除对标签影响小的特征。部分特征做离散化处理,以提高模型稳定性。建立模型后,利用网格搜索和混淆矩阵方法输出最佳参数组合。最后,保存模型,并调用模型做分类预测。
一、读取数据
二、探索数据
三、特征筛选
四、模型构建
五、模型评估
六、决策树
七、模型保存与读取