机器学习算法基础-数据降维

最新推荐文章于 2024-09-08 15:12:17 发布

起个用户名太难了

最新推荐文章于 2024-09-08 15:12:17 发布

阅读量109

点赞数

文章标签：算法 sklearn 机器学习

本文链接：https://blog.csdn.net/weixin_46964639/article/details/120688256

版权

机器学习算法基础二

数据降维

数据降维

特征选择

特征选择的原因

冗余：部分特征的相似性高，容易消耗计算性能
噪声：部分特征对预测结果有影响

特征选择的方法

Filter-过滤式

该方法使用sklearn.feature_selection.VarianceThreshold

VarianceThreshold(threshold=0.0):删除所有低方差特征

from sklearn.feature_selection import VarianceThreshold
X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]
sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
sel.fit_transform(X)
array([[0, 1],
       [1, 0],
       [0, 0],
       [1, 1],
       [1, 0],
       [1, 1]])

主成分分析

本质：一种分析，简化数据集的技术
目的：尽可能降低原数据的维度(复杂度)，损失少量信息
作用：可以削减回归分析或聚类分析中特征的数量
该方法使用sklearn.decomposition

起个用户名太难了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法基础-数据降维

机器学习算法基础二数据降维特征选择特征选择的原因特征选择的方法Filter-过滤式主成分分析数据降维特征选择特征选择的原因冗余：部分特征的相似性高，容易消耗计算性能噪声：部分特征对预测结果有影响特征选择的方法Filter-过滤式该方法使用sklearn.feature_selection.VarianceThresholdVarianceThreshold(threshold=0.0):删除所有低方差特征主成分分析本质：一种分析，简化数据集的技术目的：尽可能降低原数据的维度
复制链接

扫一扫