sklearn之PCA

PCA(主成分分析)是数据降维的重要工具。`sklearn`中的PCA提供了components_、explained_variance_ratio_和explained_variance_等属性来了解降维效果。n_components参数可以通过学习曲线、信息占比、特征需求或最大似然估计来选择。inverse_transform虽然不能完全恢复原始数据,但在高维空间中可以过滤噪声。PCA的svd_solver参数影响矩阵分解方式,有四种模式可选。博客还涵盖了PCA的参数、属性和接口列表。
摘要由CSDN通过智能技术生成

属性components_,

输出降维后新的特征空间

print(PCA(2).fit(x).components_) # svd求出的新的特征空间

属性explained_variance_ratio_,

查看降维后每个新特征向量所占的信息量占原始数据总信息量的百分比,又叫做可解释方差贡献率

print(PCA(2).fit(x).explained_variance_ratio_)
# array([0.92461872, 0.05306648])

属性explained_variance_

查看降维后每个新特征向量上所带的信息量大小(可解释性方差的大小)

print(PCA(2).fit(x).explained_variance_)
# array([4.22824171, 0.24267075])

重要参数n_components

1.通过学习曲线选超参数

from sklearn.model_selection import cross_val_score
from sklearn.decomposition import PCA
from  matplotlib import pyplot as plt
import numpy as np

# n_components 参数选择

# 1.学习曲线选超参数
pca_line = PCA().fit(x) # n_components不填 默认转换向量空间不降维
# cumsum 累加
plt.plot
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值