高维数据的可视化
n_components是我们降维后需要的维度,即降维后需要保留的特征数量,降维流程中第二步里需要确认的k值,一般输入[0, min(X.shape)]范围中的整数。
调用库和模块
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
提取数据集
iris = load_iris()
x = iris.data
y = iris.target
x.shape
#作为数据表或特征矩阵,x是几维
import pandas as pd
pd.DataFrame(x)
建模 调用PCA
pca = PCA(n_components=2)#实例化
pca = pca.fit(x)#拟合模型
x_dr = pca.transform(x)#获取新矩阵
#也可以一步到位
#x_dr = PCA(2).fit_transform(x)
x_dr
可视化
x_dr[y ==0,0]#采用布尔索引
#画出分类图
plt.figure()