GBDT提取特征的实现

最新推荐文章于 2024-02-07 21:52:22 发布

Panpan Wei

最新推荐文章于 2024-02-07 21:52:22 发布

阅读量1.9k

点赞数 2

分类专栏：机器学习文章标签： GBDT

本文链接：https://blog.csdn.net/jodie123456/article/details/100971200

版权

Python实现：

上一篇博客已经介绍了使用GBDT提取特征的思想，参考：https://blog.csdn.net/jodie123456/article/details/100630547

但是算法的难点在于如何获得GBDT模型每个叶子节点的输出状况，而这可以通过sklearn包中GradientBoostingRegressor的apply函数实现，其原理如下：

上面为GBDT模型下的两棵树，红色部分为某一样本x经过GBDT模型apply函数后的输出，为一个数组（4,6），但是（4,6）这样的数字是不能直接作为特征作为线性模型的输入的，因为这些数字只是一个位置的信息，并没有量的含义，所以需要用sklearn中的onehot编码（pandas中是dummy数据）将其转化为01码。
参考代码如下：

import numpy as np
import pandas as pd
from sklearn import linear_model
from sklearn.preprocessing import OneHotEncoder
from sklearn.ensemble import GradientBoostingRegressor
gbr=Gra

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Panpan Wei

关注关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
GBDT提取特征的实现

Python实现：上一篇博客已经介绍了使用GBDT提取特征的思想，参考：https://blog.csdn.net/jodie123456/article/details/100630547但是算法的难点在于如何获得GBDT模型每个叶子节点的输出状况，而这可以通过sklearn包中GradientBoostingRegressor的apply函数实现，其原理如下：上面为GBDT模型...
复制链接

扫一扫