矩阵python如何处理_python – 如何处理巨大的矩阵?

这篇博客探讨了在Python中处理大型矩阵的问题,特别是在监督学习的主题检测任务中。由于矩阵尺寸(202180 x 15000)过大,作者遇到将数据输入模型的困难。文章介绍了如何使用Numpy创建稀疏矩阵,并提到了逻辑回归是目前唯一可行的模型。此外,还分享了代码示例,展示了如何读取和处理文本数据以构建矩阵,以及如何使用LogisticRegression模型进行训练和预测。
摘要由CSDN通过智能技术生成

我正在通过监督学习进行主题检测.但是,我的矩阵尺寸非常大(202180 x 15000),我无法将它们放入我想要的模型中.大多数矩阵由零组成.只有逻辑回归才有效.有没有办法让我可以继续使用相同的矩阵,但是让他们能够使用我想要的模型?我可以用不同的方式创建我的矩阵吗?

这是我的代码:

import numpy as np

import subprocess

from sklearn.linear_model import SGDClassifier

from sklearn.linear_model import LogisticRegression

from sklearn import metrics

def run(command):

output = subprocess.check_output(command, shell=True)

return output

加载词汇

f = open('/Users/win/Documents/wholedata/RightVo.txt','r')

vocab_temp = f.read().split()

f.close()

col = len(vocab_temp)

print("Training column size:")

print(col)

创建火车矩阵

row = run('cat '+'/Users/win/Documents/wholedata/X_tr.txt'+" | wc -l").split()[0]

print("Training row size:")

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值