GBDT构建组合特征

最新推荐文章于 2024-04-27 15:08:06 发布

SCAU_Jimmy

最新推荐文章于 2024-04-27 15:08:06 发布

阅读量6.3k

点赞数 1

分类专栏：机器学习和数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011086367/article/details/72466292

版权

最初是由Facebook在2014年提出，并被广泛运用于点击率预估项目上，被证明有效。动机在于GBDT无法直接处理海量的离散特征，复杂度太高，所以主要思路就是就是先用已有特征训练GBDT模型，然后利用GBDT模型学习到的树来构造新特征，最后把这些新特征加入原有特征一起训练模型，事实上就是一种stacking的模型融合方式。构造的新特征向量是取值0/1的，向量的每个元素对应于GBDT模型中树的叶

摘要由CSDN通过智能技术生成

最初是由Facebook在2014年提出，并被广泛运用于点击率预估项目上，被证明有效。

动机在于GBDT无法直接处理海量的离散特征，复杂度太高，所以主要思路就是就是先用已有特征训练GBDT模型，然后利用GBDT模型学习到的树来构造新特征，最后把这些新特征加入原有特征一起训练模型。构造的新特征向量是取值0/1的，向量的每个元素对应于GBDT模型中树的叶子结点。当一个样本点通过某棵树最终落在这棵树的一个叶子结点上，那么在新特征向量中这个叶子结点对应的元素值为1，而这棵树的其他叶子结点对应的元素值为0。新特征向量的长度等于GBDT模型里所有树包含的叶子结点数之和。最后的输出一般会接一个Logistic Regression，事实上就是一种stacking的模型融合方式。

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
GBDT构建组合特征

最初是由Facebook在2014年提出，并被广泛运用于点击率预估项目上，被证明有效。动机在于GBDT无法直接处理海量的离散特征，复杂度太高，所以主要思路就是就是先用已有特征训练GBDT模型，然后利用GBDT模型学习到的树来构造新特征，最后把这些新特征加入原有特征一起训练模型，事实上就是一种stacking的模型融合方式。构造的新特征向量是取值0/1的，向量的每个元素对应于GBDT模型中树的叶
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。