树模型:
例如:决策树,随机森林,梯度提升树等等:
有一个model.feature_importances_方法
可以获取特征重要性 然后结合pandas一些手段 进行一些优化排序
# 输出特征重要性
fi=pd.DataFrame(zip(df.columns,bestModel.feature_importances_),columns=['列名','重要性'])
fi.sort_values(ascending=False,by='重要性')
非树模型:
非树模型没有feature_importances_方法
所以我们一般查看系数作为评判标准
如下(这里使用的是支持向量机举例子):
svc_cof=np.array(model_svc.coef_[0])
pd.DataFrame(zip(df.columns,svc_cof)).sort_values(by=1,ascending=False)