官方文档的搬运工
https://docs.scipy.org/doc/scipy/reference/sparse.html
几种常见的稀疏矩阵类型
coo_matrix
COO是构建稀疏矩阵的快速格式,可以转化为CSR或者CSC后进行快速的矩阵运算,本质是只储存矩阵中有值的数据
from scipy.sparse import coo_matrix,csr_matrix,csc_matrix
最常使用的构造方式:输入为ijv三个向量
# row代表横坐标i,col代表纵坐标j,data表示对应坐标点的值,
row = np.array([0, 3, 1, 0])
col = np.array([0, 3, 1, 2])
data = np.array([4, 5, 7, 9])
coo = coo_matrix((data, (row, col)), shape=(4, 4)).toarray()
print(coo)
结果
[[4 0 9 0]
[0 7 0 0]
[0 0 0 0]
[0 0 0 5]]
值得注意的是,COO矩阵可以处理重复坐标,如下例子,(row,col)出现三次(0,0),分别为1,1,1,则(0,0)位置的数值为1+1+1=3
# 对于多个重复坐标,将对应值相加
row = np.array([0, 0, 1, 3, 1, 0, 0])
col = np.array([0, 2, 1, 3, 1, 0, 0])
data = np.array([1,