主成分分析-python机器学习实现(PCA)

最新推荐文章于 2024-03-07 15:45:07 发布

ZachhhBweg

最新推荐文章于 2024-03-07 15:45:07 发布

阅读量1.3k

点赞数 1

分类专栏： python机器学习 - 用python深入机器学习的世界文章标签： python 机器学习数据分析

本文链接：https://blog.csdn.net/weixin_44145222/article/details/105250172

版权

文章目录

numpy + pandas实现
sickit-learn直接实现

代码思路来自Python Machine Learning 3rd，本人只是做了一些修改

numpy + pandas实现

我们以pandas内置的wine库来实现，我这里采取的是本地读取

import pandas as pd
df_wine = pd.read_csv('./wine.data')

1. 标准化原始数据集

# 首先分离数据集
from sklearn.model_selection import train_test_split
X, y = df_wine.iloc[:, 1:], df_wine.iloc[:, 0]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, stratify=y, random_state=0)

# 标准化
from sklearn.preprocesssing import StandardScalor
sc = StandardScalor()
X_train_std = sc.fit_transform(X_train)
X_test_std = sc.transform(X_test)

2. 获得协方差矩阵

使用numpy API

import numpy as np
cov_mat = np.cov(X_train_std.T)

3. 获得特征向量和特征值

使用numpy API

eigen_vals, eigen_vecs = np.linalg.eigh(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZachhhBweg

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
主成分分析-python机器学习实现(PCA)

文章目录numpy + pandas实现1. 标准化原始数据集2. 获得协方差矩阵3. 获得特征向量和特征值4. 按照特征值降序排列相应的特征向量5. 选择k个特征值最大的特征向量6. 获得k维矩阵，W7. 使用W实现维度转换sickit-learn直接实现代码思路来自Python Machine Learning 3rd，本人只是做了一些修改numpy + pandas实现我们以panda...
复制链接

扫一扫