lgbm输出特征重要性

lgb_clf = lgb.LGBMClassifier(objective='binary',num_leaves=35,max_depth=6,learning_rate=0.05,seed=2018,
        colsample_bytree=0.8,subsample=0.9,n_estimators=20000)
lgb_model = lgb_clf.fit(train_x[features], train_x[target], eval_set=[(test_x[features], test_x[target])], early_stopping_rounds=200)
lgb_predictors = [i for i in train_x[features].columns]
lgb_feat_imp = pd.Series(lgb_model.feature_importances_, lgb_predictors).sort_values(ascending=False)
lgb_feat_imp.to_csv('lgb_feat_imp.csv')

然而特征重要性的结果并不是很可靠,也不能反应特征相互组合对logloss的影响。故我们使用warpper的方式来进行特征选择。将前向搜索、后向搜索和随机搜索进行组合筛选出最终特征。

Ref:https://zhuanlan.zhihu.com/p/32749489

  • 0
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以帮你解决这个问题。LGBM(Light Gradient Boosting Machine)是一种常用的机器学习算法,它能够对数据进行快速高效的训练和预测。而特征重要性是指在模型中哪些特征对结果的影响更大,因此可视化特征重要性可以帮助我们更好地了解模型的表现。 以下是使用Python和LGBM包进行特征重要性可视化的代码: ```python import lightgbm as lgb import matplotlib.pyplot as plt import seaborn as sns import numpy as np # 加载数据 data = lgb.Dataset(X_train, label=y_train) # 设置模型参数 params = {'boosting_type': 'gbdt', 'objective': 'regression', 'metric': {'l2', 'rmse'}, 'num_leaves': 31, 'learning_rate': 0.05, 'feature_fraction': 0.9} # 模型训练 lgb_model = lgb.train(params, data, num_boost_round=100) # 特征重要性 importance = lgb_model.feature_importance() feature_name = lgb_model.feature_name() # 将特征重要性进行归一化 importance = np.array(importance) / np.sum(importance) # 将特征重要性按照从高到低进行排序 idx_sorted = np.argsort(importance)[::-1] # 可视化 sns.set(font_scale=1.2) fig, ax = plt.subplots(figsize=(8, 6)) sns.barplot(x=importance[idx_sorted][:20], y=feature_name[idx_sorted][:20], color='blue') plt.xlabel('Normalized Importance') plt.ylabel('Features') plt.title('Top 20 Feature Importance') plt.show() ``` 在这段代码中,我们首先加载数据并设置LGBM模型的参数。然后,我们使用训练数据训练模型,并使用feature_importance()函数计算特征重要性。接着,我们将特征重要性进行归一化,并按照从高到低的顺序排序。最后,使用seaborn包中的barplot函数进行可视化。 你可以根据自己的数据和需求进行调整和修改,希望对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值