利用特征提取进行特征降维

最新推荐文章于 2023-12-30 13:03:12 发布

Rocket,Qian

最新推荐文章于 2023-12-30 13:03:12 发布

阅读量2.5k

点赞数 1

分类专栏：机器学习工具 # sklearn 文章标签：机器学习 python

本文链接：https://blog.csdn.net/weixin_44127327/article/details/108584211

版权

本文介绍了几种特征降维的方法，包括使用主成分分析(PCA)进行线性降维，解决线性不可分数据的核PCA，通过最大化类间可分性的线性判别分析(LDA)，非负矩阵分解(NMF)以及针对稀疏矩阵的截断奇异值分解(TSVD)。这些技术在减少特征数量的同时保留数据的主要信息。

摘要由CSDN通过智能技术生成

1. 使用主成分进行特征降维

问题描述：对于给定的一组特征，在保留信息量的同时减少特征的数量

解决方案：

from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn import datasets

digits = datasets.load_digits()
#标准化特征矩阵
features = StandardScaler().fit_transform(digits.data)
#创建可以保留99%信息量(用方差表示)的PCA
pca = PCA(n_components=0.99,whiten = True)
#执行PCA
features_pca = pca.fit_transform(features)
#显示结果
print("Original number of features:",features.shape[1])
print("Reduced number of features:",features_pca.shape[1])
#output:
Original number of features: 64
Reduced number of features: 54