一、学习知识点概要
- 1、金融风控领域常用的机器学习模型
- 2、建模与调参流程
二、学习内容
- 1、逻辑回归
- 2、树模型
- 3、集成模型
- Bagging:随机森林
- Boosting:XGBoost、LightGBM、CatBoost
- 4、模型对比与性能评估
- 1、回归模型、树模型、集成模型
- 2、模型评估方法
- 3、模型评估结果
- 5、模型调参
- 1、贪心调参方法
- 2、网络调参方法
- 3、贝叶斯调参方法
三、学习问题与解答
对于数据集的划分,我们通常要保证满足以下两个条件:
- 训练集和测试集的分布要与样本真实分布一致,即训练集和测试集都要保证是从样本真实分布中独立同分布采样而得;
- 训练集和测试集要互斥
数据集划分总结
- 对于数据量充足的时候,通常采用留出法或者k折交叉验证法来进行训练/测试集的划分;
- 对于数据集小且难以有效划分训练/测试集时使用自助法;
- 对于数据集小且可有效划分的时候最好使用留一法来进行划分,因为这种方法最为准确
四、学习思考与总结
针对性了解不同模型的调参思想