sklearn 中 pca.components_

通过李航的《统计学习方法》(我愿称之为最强),可以很清晰地知道PCA的证明和各个参数的的定义。

pca主成分求解的过程是:

  1. 将数据进行标准化处理(均值为0,方差为1(可选))
  2. 求原样本中n个特征的协方差矩阵
  3. 对协方差矩阵进行特征值分解,并将特征向量组成的矩阵按照对应特征值的大小顺序进行排序,前 k 个特征向量即为前k个主成分。

所以我们完全可以根据定义去求解pca,在《机器学习实战》上有详细的代码:

'''
Created on Jun 1, 2011

@author: Peter Harrington
'''
from numpy import *


def loadDataSet(fileName, delim='\t'):
    fr = open(fileName)
    stringArr = [line.strip().split(delim) for line in fr.readlines()]
    datArr = [list(map(float, line)) for line in stringArr]
    dataMat = mat(datArr)
    return dataMat


def pca(dataMat, topNfeat=9999999):
    # 首先将对数据进行去中心化
    meanVal = mean(dataMat, axis=0)
    meanRemoved = dataMat - meanVal
    # 计算协方差矩阵
    covMat = cov(meanRemoved, rowvar=False)  #
    # 计算协方差矩阵的特征值和特征向量
    eigVals, eigVects = linalg.eig(covMat)
    eigValInd = argsort(eigVals)  # 从小到大排序
    eigValInd 
  • 11
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值