利用scikit-learn进行FeatureSelection

最新推荐文章于 2025-04-03 17:26:32 发布

lming_08

最新推荐文章于 2025-04-03 17:26:32 发布

阅读量8.4k

点赞数 1

分类专栏：机器学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lming_08/article/details/39210409

版权

机器学习专栏收录该内容

14 篇文章

订阅专栏

1.单变量特征选择(Univariate feature selection)

>>> from sklearn.datasets import load_iris
>>> from sklearn.feature_selection import SelectKBest
>>> from sklearn.feature_selection import chi2
>>> iris = load_iris()
>>> X, y = iris.data, iris.target
>>> X.shape
(150, 4)
>>> X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
>>> X_new.shape
(150, 2)

除了使用SelectKBest之外，还可以使用SelectPercentile，她是按百分比进行选择的。

2.基于树的特征选择(Tree-based Feature Selection)

>>> from sklearn.ensemble import ExtraTreesClassifier
>>> from sklearn.datasets import load_iris
>>> iris = load_iris()
>>> X, y = iris.data, iris.target
>>> X.shape
(150, 4)
>>> clf = ExtraTreesClassifier()
>>> X_new = clf.fit(X, y).transform(X)
>>> clf.feature_importances_  
array([ 0.04...,  0.05...,  0.4...,  0.4...])
>>> X_new.shape               
(150, 2)

两种方法我都试过，感觉对于人群标签来说，第二种方法要好些。

参考资料：http://scikit-learn.org/dev/modules/feature_selection.html#feature-selection

http://scikit-learn.org/dev/auto_examples/ensemble/plot_forest_importances.html#example-ensemble-plot-forest-importances-py

博客等级

码龄15年

66
原创

83
点赞

311
收藏

156
粉丝

关注

私信

热门文章

分类专栏

机器学习 14篇
网络编程 1篇
Hadoop 5篇
数据结构与算法 4篇
点云三维重建 5篇
PCL 7篇
数学 3篇
C/C++ 6篇
工具 4篇
OpenCV 2篇
Java 2篇
R 1篇
Python 12篇
Scala 3篇
计算广告学
爬虫 1篇
Linux 2篇
Spark 2篇
database 1篇

最新评论

使用TensorFlow比较逻辑回归交叉熵与平方误差损失函数结果
CSDN-Ada助手: 非常感谢博主分享关于使用TensorFlow比较逻辑回归交叉熵与平方误差损失函数结果的文章，我觉得这篇文章非常有深度和实用性。这样的技术文章对于其他用户来说也是非常有帮助的。下一篇你可以继续就TensorFlow的其他算法或模型进行深入探讨，比如深度学习的卷积神经网络或循环神经网络的应用，相信会有更多读者受益于你的分享。期待你的下一篇技术文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Diagnostics: Exception from container-launch
qq_41981069: 博主能回复一下这个在哪配置嘛
Diagnostics: Exception from container-launch
Amos_Mu: 对啊你说的这个在哪配置呀
点云的曲面法向量估计
qq_38523773: 博主，为什么我的显示是无法打开pdb文件，c盘
PCL源码剖析之MarchingCubes算法
weixin_45654025: 您好，请问在确定等值面的时候，就是用的最近邻点的切平面作为等值面么？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。