降维是数据处理中一个常见的步骤,它可以将多维的数据降到二维甚至更低,而降维后的数据完全可以表示原数据
其中,pca降维法是我们最常用的一种
数据我用的是之前文章中爬取的nba赛事数据
def pca_data(data):
from sklearn.decomposition import PCA
x=data.drop(data.columns[0],axis=1)
#x1=x.drop('冠军',axis=1)
pca =PCA(n_components='mle') #加载PCA算法,设置降维后主成分数目为自动
reduced_X =pca.fit_transform(x)
return reduced_X