XGboost
例1 agaricus_test
(稀疏数据集的特殊存储方式),01矩阵通过只表示1的位置
①读取数据
②参数设置(二分类)
Param-树的深度、eta—防止模型学习太快-衰减因子<1、silent—
Watchlist监控模型学习何时停止,
evals-训练期间将评估指标的验证集列表,验证列表会帮助我们跟踪模型性能
N_round—决策树数量
Data_train-包含x和y,obj定义一个目标函数写入公式,
③计算错误率
例2:鸢尾花
①数据读取
②参数设定(三分类softmax)
例3 wine
①数据读取分割
②logistic
③xgboost分类–分类标记必须从0开始,需要调整分类名称
taitanic
数据处理部分
①对性别进行映射
②缺失值处理
③使用随机森林预测年龄
④对其实城市编码
⑤数据划分
训练就是直接调用
注:大数据维度高-精度优先用CNN或者SVM(调参)