【python】numpy实现PCA降维

最新推荐文章于 2024-01-30 10:57:32 发布

昵称已被吞噬~‘(*@﹏@*)’~

最新推荐文章于 2024-01-30 10:57:32 发布

阅读量905

点赞数 1

分类专栏：机器学习 numpy python 文章标签：机器学习 numpy python

本文链接：https://blog.csdn.net/weixin_41369892/article/details/103448676

版权

python 同时被 3 个专栏收录

19 篇文章 1 订阅

订阅专栏

机器学习

12 篇文章 0 订阅

订阅专栏

numpy

2 篇文章 0 订阅

订阅专栏

import numpy as np

class PCA:
    def __init__(self, fileName, splitBy=' '):
        self.readData = np.array([line.split(splitBy) for line in open(fileName).readlines()], dtype='float')   # 读取数据为numpy矩阵
        nan_index = np.where(np.isnan(self.readData))   # 获取Nan值的坐标
        self.readData[nan_index] = np.take(np.nanmean(self.readData, axis=0), nan_index[1])     # 将Nan值替换为列均值
        self.initData = self.readData - self.readData.mean(axis=0)  # 得到去均值的数据矩阵
        self.Cov = np.cov(self.initData.T)  # 计算其协方差矩阵
        self.EValue, self.EVector = np.linalg.eig(self.Cov)   # 计算其特征值和特征向量

    def RecudeDimension(self, dim):     # 计算降维后的数据,前dim总方差贡献率，前dim各方差贡献率
        return np.dot(self.initData, self.EVector[:, :dim]), \
               [self.EValue[i]/sum(self.EValue) for i in range(dim)], \
               sum(self.EValue[:dim])/sum(self.EValue)

if __name__ == '__main__':
    pca = PCA('./PCA/secom.data')
    data, vals, vals_sum = pca.RecudeDimension(20)
    print('降维后的数据:', data)
    print('前20个特征的方差贡献率：', vals)
    print('前20个特征的总方差贡献率：', vals_sum)

数据集链接：(https://pan.baidu.com/s/1BB3TRVvK-BALs_Uwe0ejIw
提取码：tdlp

昵称已被吞噬~‘(*@﹏@*)’~

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【python】numpy实现PCA降维

import numpy as npclass PCA: def __init__(self, fileName, splitBy=' '): self.readData = np.array([line.split(splitBy) for line in open(fileName).readlines()], dtype='float') # 读取数据为num...
复制链接

扫一扫