一、PCA降维(主成分分析)
PCA是最常用的无监督降维算法
其原理是寻找方差最大维度,只是最大化类间样本的方差
例如,已知存在数据点如下图
PCA算法寻找方差最大维度
PCA案例:iris降维
%matplotlib inline
import matplotlib.pyplot as plt
from sklearn import decomposition
from sklearn import datasets
iris = datasets.load_iris() # 加载数据集
X = iris.data # 获取特征数据集
y = iris.target # 获取标签数据集
pca = decomposition.PCA(n_components=2) # n_components:目标维度,需要降维成n_compone