稀疏矩阵的cos相似度

每行是一个向量,计算之后对角线为1,其余为与其他向量的相似度:

def csr_cosine_similarity(input_csr_matrix):
    similarity = input_csr_matrix * input_csr_matrix.T
    square_mag = similarity.diagonal()
    inv_square_mag = 1 / square_mag
    inv_square_mag[np.isinf(inv_square_mag)] = 0
    inv_mag = np.sqrt(inv_square_mag)
    return similarity.multiply(inv_mag).T.multiply(inv_mag)

例子:

test = np.random.random_integers(0,1,(3,3))
test
array([[1, 1, 0],
       [0, 0, 1],
       [0, 1, 0]])
test = sp.csc_matrix(test)
similarity = test * test.T
similarity.todense()

matrix([[2, 0, 1],
        [0, 1, 0],
        [1, 0, 1]], dtype=int32)


np.sqrt(1 / similarity.diagonal())
array([0.70710678, 1.        , 1.        ])

similarity.multiply(np.sqrt(1 / similarity.diagonal())).todense()
matrix([[1.41421356, 0.        , 1.        ],
        [0.        , 1.        , 0.        ],
        [0.70710678, 0.        , 1.        ]])

稀疏矩阵的multiply 方法乘以向量,等价于每行点乘这个向量。
乘以矩阵,等价于点乘。
使用dot方法乘以矩阵才是矩阵乘法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值