十三、机器学习四大神器之XGBoost、LightGBM、Catboost和NGBoost

前言:
XGBoost、LightGBM 和 Catboost 是三个基于 GBDT(Gradient Boosting Decision Tree)代表性的算法实现

GBDT 是机器学习中的一个非常流行并且有效的算法模型

  • XGBoost(eXtreme Gradient Boosting):2014 年陈天奇博士提出的, 特点是计算速度快,模型表现好,可以用于分类和回归问题中
  • LightGBM(Light Gradient Boosting Machine):2017年1月,由微软开源的一个机器学习框架,它的训练速度和效率更快、使用的内存更低、准确率更高、并且支持并行化学习与处理大规模数据
  • Catboost( Categorical Features+Gradient Boosting):2017年4月,俄罗斯的搜索巨头 Yandex 开源的框架,采用的策略在降低过拟合的同时保证所有数据集都可用于学习。性能卓越、鲁棒性与通用性更好、易于使用而且更实用。据其介绍 Catboost 的性能可以匹敌任何先进的机器学习算法
  • NGBoost:2019年10月,Stanford 吴恩达团队提出。暂时在早期,目前还在主要使用前三个

常用预测(分类,回归)模型:

  • 分类算法:LR , SVM,KNN
  • 矩阵分解:FunkSVD,BiasSVD,SVD++
  • FM模型:FM, FFM, DeepFM, NFM,AFM
  • 树模型:GBDT, XGBoost, LightGBM, CatBoost,NGBoost
  • Attention模型:DIN, DIEN, DSIN

好的特征工程决定模型的上限

XGBoost算法模型参考我的另一篇文章:https://blog.csdn.net/s_daqing/article/details/118424605?spm=1001.2014.3001.5501

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
XGBoostLightGBMCatBoost是三种常用的梯度提升树算法,它们在机器学习竞赛和实际应用中都取得了很好的效果。下面是它们的调参介绍: 1. XGBoost调参: - 学习率(learning rate):控制每次迭代中模型权重的更新步长,一般取值范围为[0,1],较小的学习率可以使模型更加稳定,但需要更多的迭代次数。 - 树的数量(n_estimators):决定了模型中树的个数,一般需要通过交叉验证来确定合适的值。 - 树的深度(max_depth):控制每棵树的最大深度,较大的深度可以提高模型的拟合能力,但也容易导致过拟合。 - 正则化参数(lambda、alpha):用于控制模型的复杂度,防止过拟合。 - 特征子采样比例(colsample_bytree):控制每棵树在训练时随机选择的特征比例,可以降低模型的方差。 2. LightGBM调参: - 学习率(learning_rate):同样控制每次迭代中模型权重的更新步长。 - 树的数量(num_iterations):决定了模型中树的个数。 - 树的深度(max_depth):控制每棵树的最大深度。 - 叶子节点数(num_leaves):控制每棵树的叶子节点数,较大的值可以提高模型的拟合能力,但也容易导致过拟合。 - 特征子采样比例(feature_fraction):控制每棵树在训练时随机选择的特征比例。 - 数据子采样比例(bagging_fraction):控制每次迭代时随机选择的训练数据比例。 3. CatBoost调参: - 学习率(learning_rate):同样控制每次迭代中模型权重的更新步长。 - 树的数量(iterations):决定了模型中树的个数。 - 树的深度(depth):控制每棵树的最大深度。 - 正则化参数(l2_leaf_reg):用于控制模型的复杂度,防止过拟合。 - 特征子采样比例(colsample_bylevel):控制每棵树在训练时随机选择的特征比例。 - 数据子采样比例(subsample):控制每次迭代时随机选择的训练数据比例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值