scipy和pytorch的sparse库有啥区别

Kkkkaii

已于 2022-12-24 21:02:21 修改

阅读量1.5k

点赞数

分类专栏： PyTorch 文章标签： linux python pytorch 经验分享

于 2022-03-29 23:38:33 首次发布

本文链接：https://blog.csdn.net/hugvgngj/article/details/123835322

版权

PyTorch 专栏收录该内容

12 篇文章 1 订阅

订阅专栏

这个问题具体是针对coo matrix这个存储方式问的

sparse库

首先sparse库是用来存储稀疏矩阵的，pytorch和scipy都有这么个库（好像pytorch比较高的版本才有）。sparse库最主要的就是稀疏矩阵的表示，一般使用三元组的方式存储：（行，列，值），比如scipy的 coo_matrix((data, (i, j)), [shape=(M, N)])

pytorch和scipy的sparse有啥区别

因为看到GNN一些代码里在处理邻接矩阵的时候会把pytorch的sparse转换成scipy的，做个normalization再变回pytorch的sparse，不知道为啥要这么做。

原因：scipy的sparse才能做sum, max这种操作，pytorch的暂时还不支持

总的来说scipy的sparse比pytorch的强大很多，可以理解成pytorch的就只能拿来做矩阵乘法什么的，具体支持内容可以查看官方文档，拉到最底下就是：

scipy: scipy.sparse.coo_matrix
pytorch: pytorch sparse

后来又发现scipy的sparse可以稀疏矩阵乘以稀疏矩阵，pytorch的不行！！

例子

好像字太少链接太多被标记为质量不佳。。。贴一下二者怎么相互转换的吧

def sparse_mx_to_torch_sparse_tensor(sparse_mx):
    """Convert a scipy sparse matrix to a torch sparse tensor."""
    sparse_mx = sparse_mx.tocoo().astype(np.float32)
    indices = torch.from_numpy(
        np.vstack((sparse_mx.row, sparse_mx.col)).astype(np.int64))
    values = torch.from_numpy(sparse_mx.data)
    shape = torch.Size(sparse_mx.shape)
    return torch.sparse.FloatTensor(indices, values, shape)


def torch_sparse_tensor_to_sparse_mx(torch_sparse):
    """Convert a torch sparse tensor to a scipy sparse matrix."""


    m_index = torch_sparse._indices().numpy()
    row = m_index[0]
    col = m_index[1]
    data = torch_sparse._values().numpy()

    sp_matrix = sp.coo_matrix((data, (row, col)), shape=(torch_sparse.size()[0], torch_sparse.size()[1]))

    return sp_matrix
    ```