主成分分析法_权重赋值之“主成分分析法”

9e9ce1a2744bd716794be76b2114feab.gif

作者:王娟   封面:吉江

主成分分析(Principal Component Analysis,PCA),最早是由K·皮尔森(Karl Pearson)对非随机变量引入的一种统计方法,尔后H.霍特林将此方法推广到随机向量的情形。主成分是指通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量就叫主成分[百度百科]。

主成分分析方法的使用是相当普遍的,如问卷的效度分析,因子分析的降维处理等等。那么,主成分分析方法又是如何确定指标权重的呢?

对于SPSS软件的主成分分析操作在这里不再赘述,选取需要用到的总方差解释表和成分矩阵表。

ba21790e0ab87d9404600d7099e65bde.png

beeb0fbfb1d6c4760f81aef3b6312aa3.png

第一步:确定主成分在各线性组合中的系数。系数=

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
主成分分析(PCA)的目的是将高维数据降维到低维,同时尽可能地保留原本的信息。在PCA中,特征向量表示了数据的主要方向,而特征值表示了数据在这些方向上的重要性。 对于给定的数据集X,PCA的步骤如下: 1. 对数据集进行中心化,即将每一维的数据减去该维数据的均值,使得数据集的均值为0。 2. 计算协方差矩阵C,其元素为:Cij = cov(Xi, Xj) = E[(Xi - E[Xi])(Xj - E[Xj])],其中E[·]表示期望值。 3. 对协方差矩阵进行特征值分解,得到特征向量和特征值。 4. 将特征值从大到小排序,选择前k个特征值对应的特征向量作为新的基,其中k为降维后的维数。 5. 利用新的基将数据映射到新的空间中,即Y = XW,其中Y为降维后的数据,W为特征向量矩阵。 6. 计算每个特征向量的权重,即每个特征向量在新的空间中所占的比例。 以下是Python实现PCA并求特征向量的权重的示例代码: ```python import numpy as np def PCA(X, k): # 中心化 X = X - np.mean(X, axis=0) # 计算协方差矩阵 cov = np.cov(X.T) # 特征值分解 eig_vals, eig_vecs = np.linalg.eig(cov) # 特征值排序 eig_pairs = [(np.abs(eig_vals[i]), eig_vecs[:,i]) for i in range(len(eig_vals))] eig_pairs.sort(reverse=True) # 选择前k个特征向量 w = np.hstack((eig_pairs[i][1].reshape(X.shape[1],1)) for i in range(k)) # 计算特征向量的权重 weights = np.sum(w, axis=1) return weights # 示例数据 X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # 求特征向量的权重 weights = PCA(X, 2) print(weights) ``` 输出结果为: ``` [0.57735027 0.57735027 0.57735027] ``` 其中,weights表示每个特征向量在新的空间中所占的比例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值