机器学习中的算法-Xgboost算法

原创文章,如需转载请保留出处
本博客为唐宇迪老师python数据分析与机器学习实战课程学习笔记

一.集成算法思想
1.1 集成算法
将多个分类器集成起来而形成的新的分类算法。这类算法又称元算法(meta-algorithm)。最常见的集成思想有两种bagging和boosting。
1.2 举例
在这里插入图片描述
(1)看上面一个图例左边:有5个样本,现在想看下这5个人愿不愿意去玩游戏,这5个人现在都分到了叶子结点里面,对不同的叶子结点分配不同的权重项,正数代表这个人愿意去玩游戏,负数代表这个人不愿意去玩游戏。所以我们可以通过叶子结点和权值的结合,来综合的评判当前这个人到底是愿意还是不愿意去玩游戏。上面「tree1」那个小男孩它所处的叶子结点的权值是+2(可以理解为得分)。
(2)用单个决策树好像效果一般来说不是太好,或者说可能会太绝对。通常我们会用一种集成的方法,就是一棵树效果可能不太好,用两棵树呢?

(3)看图例右边的「tree2」,它和左边的不同在于它使用了另外的指标,出了年龄和性别,还可以考虑使用电脑频率这个划分属性。通过这两棵树共同帮我们决策当前这个人愿不愿意玩游戏,小男孩在「tree1」的权值是+2,在「tree2」的权值是+0.9, 所以小男孩最终的权值是+2.9(可以理解为得分是+2.9)。老爷爷最终的权值也是通过一样的过程得到的。

1.3 总结
所以说,我们通常在

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ssa-xgboost是一种用于优化xgboost算法的麻雀算法xgboost是一种强大的机器学习算法,用于解决分类问题,它通过构建多个决策树进行预测。然而,在处理具有多个特征的分类问题时,xgboost可能面临一些困难。这就是为什么引入ssa-xgboost来优化xgboost算法的原因。 ssa-xgboost利用麻雀算法来解决多特征分类问题。麻雀算法是一种模拟自然界麻雀行为的算法,通过模拟麻雀在搜索食物时的行为,找到最优解。在ssa-xgboost,麻雀算法被用于优化xgboost的参数和特征选择。 首先,ssa-xgboost使用麻雀算法来搜索最佳的xgboost参数。麻雀算法通过模拟麻雀集群个体的搜索过程来找到最优解。在ssa-xgboost,麻雀算法可以搜索xgboost的学习速率、树的深度、子样本采样等参数,以找到最佳的参数组合,从而提高xgboost的分类准确性。 其次,ssa-xgboost还利用麻雀算法来进行特征选择。在处理多特征的分类问题时,选择合适的特征对于提高分类准确性非常重要。ssa-xgboost通过麻雀算法来选择对分类结果有最大贡献的特征。麻雀算法将模拟麻雀集群个体对食物的争夺过程,从而找到对分类结果有最大影响的特征。 通过以上两个步骤,ssa-xgboost能够有效地优化xgboost算法,提高多特征分类的准确性。ssa-xgboost利用麻雀算法来搜索最优参数和选择最佳特征,从而使得xgboost在处理多特征分类问题时更加有效和准确。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值