做什么:
模型训练;
调参训练;
训练,优化得到预测模型
首先基础内容:
- 课程链接
基本原理认识 - 基础概念知识:
(1)交叉验证
(2)随机森林,XGBoost,调参+学习曲线/网格搜索+解读调参结果和过程
课程基础:
sklearn:开源的基于python语言的机器学习工具包,几乎涵盖了大部分主流机器学习算法
随机森林:集成算法中的装袋法:一次性建立多个若评估器
Xgboost:集成算法中提升法的代表算法:梯度提升树
- 树模型:分类树,回归树
- XGB:每个叶子结点上会有一个预测分数,也被称为叶子权重,即为求解的xgb最后的结果:参数模型。(每棵树之间相互递进的关系)
- xgb的超参数:k棵树;silent:打印训练的结果:建树流程
- 简单建模:探索性质
(1)xdb,随机森林,线性回归对比
(2)学习曲线,进行优化
对比之随机森林
重点