机器学习基础：降维

最新推荐文章于 2024-06-22 13:28:40 发布

要不你还是鲨了我吧

最新推荐文章于 2024-06-22 13:28:40 发布

阅读量56

点赞数

分类专栏：机器学习文章标签： sklearn 机器学习

本文链接：https://blog.csdn.net/weixin_43804202/article/details/120452661

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

降维

特征选择

概念:特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征，
特征在选择前和选择后可以改变值、也不改变值，但是选择后的特征维数肯
定比选择前小，毕竟我们只选择了其中的一部分特征。

方法

Filter(过滤式):VarianceThreshold
Embedded(嵌入式)：正则化、决策树
Wrapper(包裹式)

sklearn特征选择API:sklearn.feature_selection.VarianceThreshold
在这里插入图片描述

def var():
    """
    特征选择---删除低方差的特征
    :return:None
    """
    var = VarianceThreshold(threshold=1.0)
    data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])
    print(data)
    return None


if __name__ == "__main__":
    var()

主成分分析

PCA，全称Principal Component Analysis（主成分分析）
本质：PCA是一种分析、简化数据集的技术
使用时机:当特征数量到达上百的时候,考虑数据简化

目的:是数据维数压缩，尽可能降低原数据的维数（复杂度），损失少量信息。
作用:可以削减回归分析或者聚类分析中特征的数量

高纬度数据容易出现的问题 : 特征之间通常是线性相关的

注: n_components的赋值:小数(保留特征的百分比0~1 一般是90% ~ 95%) ; 整数(减少到的特征数量,不常用)

def pca():
    """
    主成分分析进行特征降维
    :return: None
    """
    pca = PCA(n_components=0.9)
    data = pca.fit_transform([[2, 8, 4, 5], [6, 3, 0, 8], [5, 4, 9, 1]])
    print(data)
    return None


if __name__ == "__main__":
    pca()

运行截图:
在这里插入图片描述

要不你还是鲨了我吧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础：降维

目录降维特征选择主成分分析案例降维特征选择概念:特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征，特征在选择前和选择后可以改变值、也不改变值，但是选择后的特征维数肯定比选择前小，毕竟我们只选择了其中的一部分特征。方法Filter(过滤式):VarianceThresholdEmbedded(嵌入式)：正则化、决策树Wrapper(包裹式)sklearn特征选择API:sklearn.feature_selection.VarianceThresholddef
复制链接

扫一扫