数据预处理，PCA主成分分析

最新推荐文章于 2023-12-31 21:45:46 发布

艾特曾经

最新推荐文章于 2023-12-31 21:45:46 发布

阅读量1.3k

点赞数

分类专栏： pandas 基础文章标签： PCA主成分分析

本文链接：https://blog.csdn.net/weixin_44084325/article/details/90082689

版权

pandas 基础专栏收录该内容

9 篇文章 0 订阅

订阅专栏

from sklearn.decomposition import PCA
my_pca = PCA(n_components=7) #10个属性删了3个剩7个
#数据表中不允许出现离散数据（salary，department），而且分析的left属性也不需要进行pca处理，因为是我们关注的属性
lower_mat = my_pca.fit_transform(df.drop(labels=["salary","department","left"],axis = 1))
print("Ratio:",my_pca.explained_variance_ratio_) #通过主成分分析，发现只有第一个值接近1，其他值都接近0，所以只保留第一个值就行了
sns.heatmap(pd.DataFrame(lower_mat).corr(),vmin=-1,vmax=1,cmap=sns.color_palette("RdBu",n_colors=128))
plt.show()

结果：