import numpy as np
x=np.array([2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1])
y=np.array([2.4,0.7,2.9,2.2,3.0,2.7,1.6,1.1,1.6,0.9])
# 将两行数据拼接,然后再进行转置处理
O = np.vstack((x,y)).T
print(O)
x = x.reshape(-1,1)
y = y.reshape(-1,1)
# 中心化处理
X = np.hstack((x - np.mean(x, axis=0), y - np.mean(y, axis=0)))
# 求协方差矩阵
cov_matrix = np.cov(X.T) # 计算协方差时,需要将矩阵进行转置
print(cov_matrix)
# 根据协方差矩阵求出特征值和特征向量
eigenvalues, eigenvactors = np.linalg.eig(cov_matrix) # 计算协方差矩阵的特征值和特征向量
print(eigenvalues) # 特征值
print(eigenvactors) # 特征向量
tot = sum(eigenvalues) # 求出特征值的和
var = []
for i in sorted(eigenvalues, reverse=True): # 对特征值的占比进行排序
var.append(i / tot)
print(var)
indexs = np.argsort(eigenvalues) # 将特征值按从小到大进行排序,index保留的是对应原特征值序列中的下标
print(indexs)
n_index = indexs[1:2:1]
# 选出最大特征值所对应的特征向量,并将其转化成矩阵
W = np.matrix(eigenvactors[:, n_index])
print(W)
data = O * W
print(data)
基于PCA实现降维
最新推荐文章于 2024-04-01 11:18:31 发布