十三、机器学习四大神器之XGBoost、LightGBM、Catboost和NGBoost

前言:
XGBoost、LightGBM 和 Catboost 是三个基于 GBDT(Gradient Boosting Decision Tree)代表性的算法实现

GBDT 是机器学习中的一个非常流行并且有效的算法模型

  • XGBoost(eXtreme Gradient Boosting):2014 年陈天奇博士提出的, 特点是计算速度快,模型表现好,可以用于分类和回归问题中
  • LightGBM(Light Gradient Boosting Machine):2017年1月,由微软开源的一个机器学习框架,它的训练速度和效率更快、使用的内存更低、准确率更高、并且支持并行化学习与处理大规模数据
  • Catboost( Categorical Features+Gradient Boosting):2017年4月,俄罗斯的搜索巨头 Yandex 开源的框架,采用的策略在降低过拟合的同时保证所有数据集都可用于学习。性能卓越、鲁棒性与通用性更好、易于使用而且更实用。据其介绍 Catboost 的性能可以匹敌任何先进的机器学习算法
  • NGBoost:2019年10月,Stanford 吴恩达团队提出。暂时在早期,目前还在主要使用前三个

常用预测(分类,回归)模型:

  • 分类算法:LR , SVM,KNN
  • 矩阵分解:FunkSVD,BiasSVD,SVD++
  • FM模型:FM, FFM, DeepFM, NFM,AFM
  • 树模型:GBDT, XGBoost, LightGBM, CatBoost,NGBoost
  • Attention模型:DIN, DIEN, DSIN

好的特征工程决定模型的上限

XGBoost算法模型参考我的另一篇文章:https://blog.csdn.net/s_daqing/article/details/118424605?spm=1001.2014.3001.5501

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习(Machine Learning, ML)是一种应用人工智能(AI)领域的科学技术,它使得计算机系统能够从数据中自动学习和改进,而无需显式编程。在机器学习的过程中,算法会通过识别和挖掘数据中的模式来构建一个模型,这个模型可以用于做出预测、分类、聚类、回归以及其他复杂的数据驱动决策。 机器学习的主要类型包括监督学习、无监督学习和半监督学习。在监督学习中,算法根据已知标签的数据集进行训练,以便对未知数据进行预测,例如分类任务(判断邮件是否为垃圾邮件)或回归任务(预测房价)。无监督学习则是在没有标签的情况下,仅凭数据本身的特征发现其中隐藏的结构或模式,如聚类分析(将用户分组到不同的客户细分群体中)。半监督学习介于两者之间,它部分数据有标签,部分数据无标签。 机器学习算法涵盖众多方法,包括但不限于逻辑回归、决策树、随机森林、支持向量机、K近邻算法、神经网络以及深度学习技术等。随着计算能力的增强和大数据时代的到来,机器学习已经在诸多领域展现出强大的功能,如图像识别、语音识别、自然语言处理、推荐系统、金融风控、医疗诊断等。 此外,机器学习的发展与统计学习、逼近论、凸优化、概率论等诸多数学和计算机科学领域紧密相关,且不断地推动着新算法和理论框架的创新与发展。同时,现代机器学习尤其是深度学习模型的内部工作机制有时难以完全解释,因此常被称为“黑箱”决策过程,这也是当前研究中的一个重要挑战。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值