【scikit-learn】如何查看特征重要性

Blessed_Li

已于 2024-07-10 08:56:18 修改

阅读量242

点赞数 7

文章标签： scikit-learn python 机器学习

于 2024-07-09 20:51:47 首次发布

本文链接：https://blog.csdn.net/g5guj/article/details/140301191

版权

树模型：

例如：决策树，随机森林，梯度提升树等等：

有一个model.feature_importances_方法

可以获取特征重要性然后结合pandas一些手段进行一些优化排序

# 输出特征重要性
fi=pd.DataFrame(zip(df.columns,bestModel.feature_importances_),columns=['列名','重要性'])
fi.sort_values(ascending=False,by='重要性')

非树模型：

非树模型没有feature_importances_方法

所以我们一般查看系数作为评判标准

如下（这里使用的是支持向量机举例子）：

svc_cof=np.array(model_svc.coef_[0])
pd.DataFrame(zip(df.columns,svc_cof)).sort_values(by=1,ascending=False)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Blessed_Li

关注关注

7
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

sklearn源码解析：ensemble模型零碎记录；如何看sklearn代码，以tree的feature_importance为例

mmc2015的专栏

07-12

2万+

最近看sklearn的源码比较多，好记性不如烂笔头啊，还是记一下吧。整体：）实现的代码非常好，模块化、多继承等写的很清楚。）predict功能通常在该模型的直接类中实现，fit通常在继承的类中实现，方便不同的子类共同引用。随机森林和 GBDT ）RandomForest的bootstrap是又放回的；GBDT则是无放回的。

sklearn的feature_importances_含义是什么？

weixin_37659245的博客

08-31

1万+

参考这篇回答： https://stackoverflow.com/questions/15810339/how-are-feature-importances-in-randomforestclassifier-determined/15821880#15821880 其中有Sk-learn作者的回复： There are indeed several ways to get feature “...

3 条评论您还未登录，请先登录后发表或查看评论

scikit-learn 决策树算法中特征（自变量）重要性的计算

UCAS_Leon的博客

10-09

4600

sklearn.tree.DicisionTreeClassifier类中的feature_importances_属性返回的是特征的重要性，feature_importances_越高代表特征越重要，scikit-learn官方文档1中的解释如下： The importance of a feature is computed as the (normalized) total reduction of the criterion brought by that feature. It is also

scikit-learn决策树算法中特征重要性的计算

DKY10的博客

12-05

2万+

sklean.tree.DicisionTreeClassifier类中的feature_importances_属性返回的是特征的重要性，feature_importances_越高代表特征越重要，scikit-learn官方文档1中的解释如下： The importance of a feature is computed as the (normalized) total reductio...

特征选择--scikit-learn

热门推荐

面向未来的历史

07-29

3万+

特征选择（Feature Selection）:choosing a subset of all the features(the ones more informative)。最终得到的特征选是原来特征的一个子集。特征选取是机器学习领域非常重要的一个方向。主要有两个功能：（1）减少特征数量、降维，使模型泛化能力更强，减少过拟合（2）增强度特征和特征值之间的理解 1,

三、Scikit-learn机器学习框架

小石小石摩西摩西

07-22

3万+

三、Scikit-learn机器学习框架 3.1 Scikit-learn介绍 Scikit-learn介绍对Python语言有所了解的科研人员可能都知道SciPy——一个开源的基于Python的科学计算工具包。基于SciPy，目前开发者们针对不同的应用领域已经发展出了为数众多的分支版本，它们被统一称为Scikits，即SciPy工具包的意思。而在这些分支版本中，最有名，也是专门面向机器学习的一个就是Scikit-learn。 Scikit-learn项目最早由数据科学家 David Cournape

【sklearn | 7】：scikit-learn项目实战指南

颜淡慕潇

07-17

1万+

scikit-learn是一个基于Python的开源机器学习库，建立在NumPy、SciPy和matplotlib这些科学计算库之上。它提供了简单而高效的数据挖掘和数据分析工具，包括分类、回归、聚类和降维等机器学习算法。线性模型：如线性回归、逻辑回归等。决策树：用于分类和回归问题。支持向量机（SVM）：用于分类和回归问题。随机森林：一种集成学习方法，由多个决策树组成。聚类算法：如K-means、层次聚类等。降维技术：如主成分分析（PCA）和线性判别分析（LDA）。

scikit-learn-1.0.2.tar.gz

01-18

在scikit-learn 1.0.2版本中，开发者可能对模型选择、模型评估和特征选择进行了优化。例如，交叉验证（cross-validation）是评估模型性能的关键工具，该版本可能提升了其稳定性和效率。此外，预处理步骤如标准化和...

scikit-learn-1.3.2.tar.gz

01-17

其次，scikit-learn支持数据预处理和特征选择，这对于任何机器学习项目都至关重要。在新版本中，可能会有新的预处理工具或改进的现有工具，以更好地处理缺失值、异常值，或者更有效地执行特征缩放和编码。例如，`...

scikit-survival：基于scikit-learn的生存分析

02-04

总结来说，`scikit-survival`是`scikit-learn`生态系统中的一颗璀璨明珠，它将强大的机器学习方法引入到生存分析领域，为研究人员和数据科学家提供了丰富的工具，以解决具有时间依赖性的预测问题。通过这个库，我们...

scipy+scikit-learn组件

04-20

Scipy和Scikit-learn是Python编程语言中两个非常重要的科学计算库，它们在数据分析、机器学习和数值计算领域有着广泛的应用。在这个压缩包中，我们很可能是找到了这两个库的安装包或者特定版本，用于Python 3.6的64...

python的scikit-learn将特征转成one-hot特征的方法

09-20

在机器学习领域，数据预处理是至关重要的一步，其中一种常用的数据编码技术是将类别型特征转换为数值型特征，通常采用的就是One-hot编码。在Python的机器学习库scikit-learn中，提供了`OneHotEncoder`类来实现这一...

VeighNa：强大的Python开源量化交易平台

Unity打怪升级

09-26

733

VeighNa（简称 VN 或 vn.py）是一个基于 Python 的开源量化交易平台，专为量化交易爱好者和专业交易员设计。VeighNa 是由国内开发者社区推动的开源项目，旨在提供一个功能丰富、灵活且易于扩展的量化交易解决方案。该框架不仅支持多种资产类别的交易，如股票、期货、期权、加密货币等，还支持多种交易接口和协议，使得用户能够轻松进行多市场、多品种的交易策略开发和部署。

第二百五十四节 JPA教程 - JPA 多对多映射示例

2301_78772942的博客

09-27

716

第二百五十四节 JPA教程 - JPA 多对多映射示例

（笔记）第三期书生·浦语大模型实战营（十一卷王场）--书生入门岛通关第2关Python 基础知识