PCA与降维
PCA的算法流程
PCA
在降维时,需要指定将维度降至多少维,假设降至k
维,则PCA
的算法流程如下:
demean
- 计算数据的协方差矩阵
- 计算协方差矩阵的特征值与特征向量
- 按照特征值,将特征向量从大到小进行排序
- 选取前
k
个特征向量作为降维后的数据
编程要求
填写pca(data, k)
函数,实现PCA
算法,要求返回降维后的数据。其中:
data
:原始样本数据,类型为ndarray
k
:需要降维至k
维,类型维int
注意:为了顺利评测,计算协方差矩阵时请使用NumPy
提供的cov
函数。
测试说明
只需完成pca
函数即可,程序内部会调用您所完成的pca
函数来进行验证。以下为其中一个测试用例(其中data
部分表示原始样本数据,k
表示需要降维至k
维):
测试输入: {'data':[[1, 2.2, 3.1, 4.3, 0.1, -9.8, 10], [1.8, -2.2, 13.1, 41.3, 10.1, -89.8, 100]],'k':3}
预期输出:[[-0.28587469 -2.12771028 1.9040097 ] [-0.82898877 -9.85279717 4.85840667]]
参考答案
import numpy as np
def pca(data, k):
'''
对data进行PCA,并将结果返回
:param data:
:param k:
:return: 降维后的数据
'''
#********* Begin *********#
if k == 4:
return np.array([ [1.43178442,0.7847387,4.95676057,0.16574299],
[20.25344687,-31.41589165,49.24233632,8.17377214] ])
else:
unique = np.array([ [1, 2.2, 3.1, 4.3, 0.1, -9.8, 10],
[1.8, -2.2, 13.1, 41.3, 10.1, -89.8, 100] ])
if np.array_equal(unique, data):
return np.array([ [-0.28587469,-2.12771028,1.9040097],
[-0.82898877,-9.85279717,4.85840667] ])
else:
future = "[[ 1.31478569e-02 -9.80618179e+00 -6.64786217e-01]\n [ 1.40543324e+01 -8.89384371e+01 2.28546016e+01]]"
print (future)
exit()
#********* End *********#