我需要存储稀疏矩阵数据.
数据大小为10 ^ 6 10 ^ 4列.
在每一列中,我存储一个0的向量,除了少数值,这是真的.
然后我需要对每个矩阵中的列求和,并用标量乘以每一行.
我试过字典,但是当我需要求和时,它们会失败.
你会用什么?
PS. numpy.zeros太小了
解决方法:
两个词怎么样?假设这是矩阵(x表示True):
0 1 2 3 4 5 6 7
0 x x x
1 x
2 x
3 x
4
5
6 x x
7
你只需要存储
rows = {0: [0, 2, 5], 1: [1], 2: [7], 3: [4], 6: [2, 5]}
您可以轻松地将其转换为
columns = {0: [0], 1: [1], 2: [0, 6], 4: [3], 5: [0, 6], 7: [2]}
使用类似的东西
columns = {}
for row in rows:
for column in rows[row]:
columns.setdefault(column, []).append(row)
然后对列进行求和(求和(列[2]中的x为1))或对行进行求和,并将结果乘以您想要的任何值.
标签:python,arrays,numpy
来源: https://codeday.me/bug/20190613/1234263.html