scikit-learn的PCA降维实战

本文介绍了如何在scikit-learn中使用PCA进行降维,探讨了n_components的设置,包括按比例和'MLE'方式,并解释了svd_solver的不同选项。PCA旨在提取主要成分,降低噪声,减少数据维度,同时最大化信息保留,以提升训练效率。PCA与特征选择的主要区别在于PCA是对特征的柔和处理和重新提取,而特征选择则是直接选取部分维度。
摘要由CSDN通过智能技术生成

1. 降维,降多少维度呢?降低的标准是什么:没有一个标准,这应该是一个超参数,通过pipeline和gridsearchCV进行搜索;

2.如何使用sklearn中PCA的API

a. n_components如何设置比例:n_components如何设置比例 n_components = 0.95 (表示提取95%的主成分)

n_components = 'mle' : API会根据MLE算法根据特征的方差分布情况,自己去选择一定数量的主成分特征来降维;

b. n_components即使设置比例为100%,也会对data进行处理,返回的data,维度跟原始data一样,但是每一维的主成分比例不断下降,通过pca.explained_variance_ratio_参数可以看到每一维所占的比例.

使用方法:

pca = PCA(n_components= 0.99)

pca.fit(X)

print(pca.explained_variance_ratio_) #降维后每一列方差占比

print(pca.explained_varia

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值