LightGBM算法的特别之处

自从微软推出了LightGBM,其在工业界表现的越来越好,很多比赛的Top选手也掏出LightGBM上分。所以,本文介绍下LightGBM的特别之处。

  • LightGBM算法在模型的训练速度和内存方面都有相应的优化。

    基于树模型的boosting算法,很多算法比如(xgboost 的默认设置)都是用预排序(pre-sorting)算法进行特征的选择和分裂。

    1. 首先,对所有特征按数值进行预排序。
    2. 其次,在每次的样本分割时,用O(# data)的代价找到每个特征的最优分割点。
    3. 最后,找到最后的特征以及分割点,将数据分裂成左右两个子节点。
      优缺点:
      这种pre-sorting算法能够准确找到分裂点,但是在空间和时间上有很大的开销。
      i. 由于需要对特征进行预排序并且需要保存排序后的索引值(为了后续快速的计算分裂点),因此内存需要训练数据的两倍。
      ii. 在遍历每一个分割点的时候,都需要进行分裂增益的计算,消耗的代价大。

    LightGBM采用Histogram算法,其思想是将连续的浮点特征离散成k个离散值,并构造宽度为k的Histogram。然后遍历训练数据,统计每个离散值在直方图中的累计统计量。在进行特征选择时,只需要根据直方图的离散值,遍历寻找最优的分割点。

    Histogram 算法的优缺点:

    1. Histogram算法并不是完美的。由于特征被离散化后,找到的并不是很精确的分割点,所以会对结果产生影响。但在实际的数据集上表明,离散化的分裂点对最终的精度影响并不大,
  • 5
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智能优化算法LightGBM调参的作用是通过自动化搜索和优化算法来找到最佳的参数组合,以提高LightGBM模型的性能和准确性。其中,遗传算法是一种常用的智能优化算法之一。 通过遗传算法优化LightGBM的参数,可以解决因低效率、慢收敛和局部最优等问题,得到无偏差和全局最优的参数组合。遗传算法通过模拟自然界的生物进化过程,通过交叉、变异和选择等操作,生成新的参数组合,并逐步优化这些组合,找到最优解。 在LightGBM中,通过遗传算法调参优化,可以提高模型的泛化能力和稳健性,使其在处理样本噪声和提高销量估测模型准确性方面更加有效。与传统的网格搜索(GridSearch)相比,遗传算法具有更高的搜索效率和鲁棒性,能够更好地处理参数搜索空间较大的情况。 因此,智能优化算法,特别是遗传算法,对LightGBM的调参能够帮助提高模型的性能和准确性,并且具有较好的适应性和鲁棒性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [【机器学习】LightGBM+遗传算法 调参优化](https://blog.csdn.net/guozhirourou/article/details/106436203)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值