PCA方差为0的列

我认为您没有在正确地寻找零方差列。让我们尝试一些伪数据。首先,可接受的矩阵:10x100:

PCA不能将常数的列/全部为零的列的方差重新调整为一
mat <- matrix(rnorm(1000, 0), nrow = 10)

还有一个带有零方差列的列。我们称之为oopsmat。

const <- rep(0.1,100)
oopsmat <- cbind(const, mat)

oopsmat的前几个元素如下所示:

  const                                                                                               

[1,] 0.1 0.75048899 0.5997527 -0.151815650 0.01002536 0.6736613 -0.225324647 -0.64374844 -0.7879052
[2,] 0.1 0.09143491 -0.8732389 -1.844355560 0.23682805 0.4353462 -0.148243210 0.61859245 0.5691021
[3,] 0.1 -0.80649512 1.3929716 -1.438738923 -0.09881381 0.2504555 -0.857300053 -0.98528008 0.9816383
[4,] 0.1 0.49174471 -0.8110623 -0.941413109 -0.70916436 1.3332522 0.003040624 0.29067871 -0.3752594
[5,] 0.1 1.20068447 -0.9811222 0.928731706 -1.97469637 -1.1374734 0.661594937 2.96029102 0.6040814

让我们尝试在oopsmat上缩放和未缩放的PCA:

PCs <- prcomp(oopsmat) #works
PCs <- prcomp(oopsmat, scale. = T) #not forgetting the dot
#Error in prcomp.default(oopsmat, scale. = T) :
#cannot rescale a constant/zero column to unit variance

因为如果标准偏差为无穷大,则无法将其除以。为了识别零方差列,我们可以使用which如下所示获取变量名称。

which(apply(oopsmat, 2, var)==0)
#const
#1

要从数据集中删除零方差列,可以使用相同的apply表达式,将方差设置为不等于零。

oopsmat[ , which(apply(oopsmat, 2, var) != 0)]

  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值