本次练习利用决策树算法对Titantic的survived标签做二分类。通过数据探索,发现特征存在缺失值、数据类型不规范等问题,并通过数据分析,初步认识不同特征对survived的影响程度。在数据预处理之后,借助网格搜索和混淆矩阵等方法调整参数,从而得到最优参数组合下的决策树模型。
一、初步导入库
(后面建模还会再导入库)
二、探索数据
三、分析数据
本次练习利用决策树算法对Titantic的survived标签做二分类。通过数据探索,发现特征存在缺失值、数据类型不规范等问题,并通过数据分析,初步认识不同特征对survived的影响程度。在数据预处理之后,借助网格搜索和混淆矩阵等方法调整参数,从而得到最优参数组合下的决策树模型。
一、初步导入库
(后面建模还会再导入库)
二、探索数据
三、分析数据