python sklearn包中的主成分分析_利用sklearn对大型稀疏矩阵进行主成分分析

最新推荐文章于 2022-05-27 21:56:40 发布

张雪鹏

最新推荐文章于 2022-05-27 21:56:40 发布

阅读量919

点赞数 1

文章标签： python sklearn包中的主成分分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29596789/article/details/114391190

版权

在尝试使用sklearn的RandomizedPCA对大型稀疏矩阵进行主成分分析时遇到错误。输入矩阵是形状为(2365436, 1617899)的Compressed Sparse Row格式。当直接应用RandomizedPCA时，它要求输入为稠密矩阵，而转换为稠密矩阵会导致内存错误。" 79232174,4948213,kaggle与天池大数据比赛体验对比,"['数据挖掘', 'python', 'kaggle', '天池', '比赛平台']

摘要由CSDN通过智能技术生成

我试图将主成分分析应用于大型稀疏矩阵，在下面的链接中，它说明sklearn的randomizedPCA可以处理scipy稀疏格式的稀疏矩阵。

Apply PCA on very large sparse matrix

但是，我总是犯错误。有人能指出我做错了什么吗。

输入矩阵“X_train”包含float64中的数字：>>>type(X_train)

>>>X_train.shape

(2365436, 1617899)

>>>X_train.ndim

2

>>>X_train[0]

<1x1617899 sparse matrix of type ''

with 81 stored elements in Compressed Sparse Row format>

我想做的是：>>>from sklearn.decomposition import RandomizedPCA

>>>pca = RandomizedPCA()

>>>pca.fit(X_train)

Traceback (most recent call last):

File "", line 1, in

File "/home/RT11/.pyenv/versions/2.7.9/lib/python2.7/site-packages/sklearn/decomposition/pca.py", line 567, in fit

self._fit(check_array(X))

File "/home/RT11/.pyenv/versio

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。