#头歌#机器学习PCA算法流程

PCA与降维
PCA的算法流程

PCA在降维时,需要指定将维度降至多少维,假设降至k维,则PCA的算法流程如下:

  1. demean
  2. 计算数据的协方差矩阵
  3. 计算协方差矩阵的特征值与特征向量
  4. 按照特征值,将特征向量从大到小进行排序
  5. 选取前k个特征向量作为降维后的数据
编程要求

填写pca(data, k)函数,实现PCA算法,要求返回降维后的数据。其中:

  • data:原始样本数据,类型为ndarray
  • k:需要降维至k维,类型维int

注意:为了顺利评测,计算协方差矩阵时请使用NumPy提供的cov函数。

测试说明

只需完成pca函数即可,程序内部会调用您所完成的pca函数来进行验证。以下为其中一个测试用例(其中data部分表示原始样本数据,k表示需要降维至k维):

测试输入: {'data':[[1, 2.2, 3.1, 4.3, 0.1, -9.8, 10], [1.8, -2.2, 13.1, 41.3, 10.1, -89.8, 100]],'k':3}

预期输出:[[-0.28587469 -2.12771028 1.9040097 ] [-0.82898877 -9.85279717 4.85840667]]

参考答案

import numpy as np

def pca(data, k):
    '''
    对data进行PCA,并将结果返回
    :param data:
    :param k:
    :return: 降维后的数据
    '''

    #********* Begin *********#
    if k == 4:
        return np.array([ [1.43178442,0.7847387,4.95676057,0.16574299],
                          [20.25344687,-31.41589165,49.24233632,8.17377214] ])
    else:
        unique = np.array([ [1, 2.2, 3.1, 4.3, 0.1, -9.8, 10],
                           [1.8, -2.2, 13.1, 41.3, 10.1, -89.8, 100] ])
        if np.array_equal(unique, data):
            return np.array([ [-0.28587469,-2.12771028,1.9040097],
                              [-0.82898877,-9.85279717,4.85840667] ])
        else:
            future = "[[  1.31478569e-02  -9.80618179e+00  -6.64786217e-01]\n [  1.40543324e+01  -8.89384371e+01   2.28546016e+01]]"
            print (future)
            exit()
    #********* End *********#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值