xgb\lightgbm\gbdt\rf模型如何挑选之个人思考

这四类模型均为有监督模型,都具有标签,

整体思路:具体选择哪一类,不能一概而论,需要结合具体的业务情况、数据情况、评价标准、资源、时间要求、特征解释性等综合衡量,同时需要清楚各个模型的原理、优势劣势、区别做决定。

了解数据:
1.统计描述和可视化
统计描述:均值、分位数、标准差、相关性、缺失率、异常点
可视化:箱线图(异常点)、密度图、直方图、散点图、

选取这几类算法,结合这几类算法的特点,说明几点信息:
1.数据是带标签的
2.预测分类问题
3.对模型可解释性要求不高
4.对准确性要求较高

模型复杂度
模型越复杂,要求:
1.更多的特征进行学习和预测;
2.更复杂的特征工程(多项式、交叉项、主成分等)
3.更多的计算开销

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值