Task01
- 主要应用xgb、lgb、catboost----集成模型
- pandas、numpy、matplotlib、seabon、sklearn、keras---函数库。
- print('Train data shape:',Train_data.shape)
print('TestA data shape:',Test_data.shape)
#打印数据大小,样本量,维度
Train data shape: (75414, 31) TestA data shape: (50000, 30)
4.sklearn.metrics 评价模型指标好坏的指标(分类),accuracy_score,准确率
5.baseline里面做了特征筛选,只提取了数值列(为了便于理解)
numerical_cols = Train_data.select_dtypes(exclude = 'object').columns
print(numerical_cols)
Task02
Task03
Task04
Task05