数据挖掘实战之金融风控第四课:建模与调参

一、常用算法及优缺点介绍

逻辑回归优点:简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响

缺点:不能用Logistic回归去解决非线性问题,因为Logistic的决策面是线性的;

决策树优点:简单直观,生成的决策树可以可视化展示,数据不需要预处理,不需要归一化,不需要处理缺失数据

缺点:决策树算法非常容易过拟合,导致泛化能力不强

二、集成方法主要包括Bagging和Boosting。常见的基于Baggin思想的集成模型有:随机森林、基于Boosting思想的集成模型有:Adaboost、GBDT、XgBoost、LightGBM等。

三、数据集划分总结:

对于数据量充足的时候,通常采用留出法或者k折交叉验证法来进行训练/测试集的划分;

对于数据集小且难以有效划分训练/测试集时使用自助法

对于数据集小且可有效划分的时候最好使用留一法来进行划分,因为这种方法最为准确

四、模型调参:

1. 贪心调参

2. 网格搜索:

3、贝叶斯调参

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值