PCA(principal components analysis)即主成分分析技术,意在利用降维的思想,把多个指标转化为少数几个综合指标。下面用Python实现:
from sklearn.decomposition import PCA
from sklearn import datasets
## 加载数据
iris = datasets.load_iris()
X = iris.data
y = iris.target
## 降维操作,4维降维成2维
pca = PCA(n_components=2)
pca.fit(X)
Xr = pca.transform(X)
## 降维前后,前10个样本的对比
print("降维之前(4维):\n", X[0:10], '\n')
print("降维之前(2维):\n", Xr[0:10], '\n')
降维前后的对比: