Day 43:数据降维：特征选择 & 主成分分析PCA

最新推荐文章于 2024-01-26 19:35:19 发布

Garciaxx

最新推荐文章于 2024-01-26 19:35:19 发布

阅读量294

点赞数

分类专栏：学习记录学习成长学习笔记文章标签： python 机器学习数据分析数据挖掘数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50192514/article/details/113184077

版权

Python 回忆录

2020/1/26
- 数据降维

2020/1/26

数据降维

其实就是数据特征数量的减少，和数组的维度根本不一样。对于数据降维有两个方法：
1.特征选择
2.主成分分析

特征选择

就是选择部分特征用来当作机器学习的数据。
选择特征选择的原因：

冗余：部分特征相似，关联度高。容易消耗计算性能，可以不需要。
噪声：部分特征对预测结果有很大的影响

特征选择的工具

Filter（过滤式）：VarlanceThreshold （Varlance方差）
其实就是通过方差大小考虑所有样本这个特征的方差情况。
Embedded(嵌入式)：正则化，决策树
Wrapper(包裹式，用的少)
神经网络

skilearn.feature_selection.VarianceThreshold

VarianceThreshold(threshold = 0.0) :删除所有低方差特征
Varlance.fit_transform(x): X:numpy array格式的数据，返回一个方差非0特征的数集。也就是删除所有方差为0的特征（删除所有相同值得特征）

from sklear.feature_selection import VarlanceThreshold


def var():
	va = VarlanceThreshold

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Day 43:数据降维：特征选择 & 主成分分析PCA

Python 回忆录2020/1/26数据降维特征选择特征选择的工具主成分分析降维2020/1/26数据降维其实就是数据特征数量的减少，和数组的维度根本不一样。对于数据降维有两个方法：1.特征选择2.主成分分析特征选择就是选择部分特征用来当作机器学习的数据。选择特征选择的原因：冗余：部分特征相似，关联度高。容易消耗计算性能，可以不需要。噪声：部分特征对预测结果有很大的影响特征选择的工具Filter（过滤式）：VarlanceThreshold （Varlance方差）其实就
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。