1用户流失预测分析 简单介绍下使用的基本场景是:业务部门希望数据部门能对流失用户做分析,找到流失用户的典型特征。 · 当客户在哪些特征的什么条件下比较容易发生流失行为 · 到底流失客户的哪些特性最显著 · 业务部门就能针对这些客户的典型特征做有针对性的业务优化及挽回动作。 · 数据集大概率会出现样本不均衡问题,原因是流失用户一定是少量的 代码: 填充缺失值和样本均衡 填充缺失值使用的是均值填充法 样本均衡策略用的是过抽样处理 拆分训练集和测试集 xgb训练分类器模型 定义了一个dict传参 指定分类的对象是二元分类