矩阵中行向量两两之间的欧氏距离

玉扉

于 2021-08-25 01:58:58 发布

阅读量1.6k

点赞数 2

文章标签：深度学习机器学习线性代数 paddlepaddle

本文链接：https://blog.csdn.net/yankaifyyy/article/details/119902252

版权

本文介绍了如何利用矩阵运算库如numpy、torch高效计算数据矩阵A和B之间的行向量欧氏距离，并扩展到批量处理和点集间距离计算。通过矩阵相乘优化，避免了传统循环的低效，展示了在深度学习场景下的应用实例。

摘要由CSDN通过智能技术生成

矩阵之间的行向量两两距离

给定数据矩阵 $A\in R^{n\times d}$ 和矩阵 $B\in R^{m\times d}$ ，A和B中每一行都是一个数据点，现在要去求A中所有元素和B中所有元素之间的欧氏距离。即计算矩阵 $=(d_{ij} = ||a_{i,:} - b_{j, :}||) \in R^{n\times m}$ 。
直接去做 $n\times m$ 的两层循环当然可以得到结果，但是既然数据都已经放在矩阵里了，它自然可以“并行”地去计算，好利用一些现有的矩阵计算库（比如numpy、torch）等的优化。

具体来讲，把欧氏距离的运算展开
$\begin{aligned} ||a_{i,:}-b_{j,:}||^2 & =(a_{i,:}-b_{j,:})^2 \\ & = a_{i,:}^2 + b_{j,:}^2 - 2a_{i,:}\cdot b_{j,:} \end{aligned}$

观察可以知道，式子中的三项分别等于A中第i行的平方和、B中第j行的平方和、A中第i行和B中第j行的内积，这样的话，可以分别对A和B做逐元素平方求和，而向量两两做内积，得到的结果其实就是A与B转置相乘。矩阵相乘作为一个经典操作那是被优化得好好的，比起自己去做两层循环方便得多。

整个过程就成了 $A)^T + RowSum(B .* B) - 2A\cdot B^T$ 。

这里有个问题，A平方和之后转置得到的是 $n\times 1$ 的向量，B平方和得到的是 $1\times m$ 的向量，要把它们都扩展成 $n\times m$ 的向量才好相加。幸运的是，现在常见的矩阵运算库基本都是有“广播”功能的。当向量 $\in R^{n\times 1}$ 和向量 $u\in R^{1\times m}$ 相加时，它们分别会被自动扩展成为矩阵 $V\in R^{n\times m}$ 和 $U\in R^{n\times m}$ ，显然可以想到V就是把v复制了m列，U是把u复制了n行。通过自动广播，维度的处理就完全不是问题了。

具体代码如下

# numpy version
A2 = (A ** 2).sum(axis=1).reshape((-1, 1))	# 转为n*1
B2 = (B ** 2).sum(axis=1) # 这里不用reshape了，(n,)和(1,n)的向量在计算过程中效果是一样的
D = A2 + B2 - 2 * A.dot(B.transpose())
# D = np.clamp(D, a_min=0) # 有时候会出现精度问题导致结果小于0 ，我习惯于在这里进行一次校正
D = D.sqrt()	# 开方得到欧氏距离
# ...

# torch version
A2 = (A ** 2).sum(dim=1).reshape((-1, 1))
B2 = (B ** 2).sum(dim=1)
D = A2 + B2 - 2 * A.mm(B.t())
# ...

实际场景经常会遇到一个点矩阵 $A\in R^{a\times d}$ 需要求所有数据点之间的两两距离，此时就可以用上面的方式去计算A和A自身的两两距离。

批量计算点集与点集之间的两两距离

今天在做实验时遇到这样一个场景， $X\in R^{B\times n\times d}$ 和 $Y\in R^{B\times m\times d}$ ，其实这也是玩深度学习时常会出现到的情况，就是数据集被划分为一个一个的Batch，这里我想对每一个batch b分别计算 $X [b, :, :]$ 和 $Y [b, :, :]$ 这两个矩阵中的两两距离，放在常用的计算库（如torch、paddle等）中，一样是可以转换为矩阵运算的，只是需要做一点点的reshape而已。

# paddle version
X2 = (X ** 2).sum(axis=2).reshape((batch_size, 1, -1))
Y2 = (Y ** 2).sum(axis=2).reshape((batch_size, -1, 1)) # 由于多了第一维，这里的reshape不能偷懒不写了
D = X2 + Y2 - 2 * X.bmm(Y.transpose((0, 2, 1)))

之所以能这么做，得益于很多库实现了bmm运算，即对每个batch分别进行矩阵乘法（这个函数应用于张量的时代，在numpy里还没有）。

这一需求其实在pytorch中有一个特定的函数torch.cdist完成了。然而很不幸的百度paddle框架中并没有类似函数，所以只能自己实现了一版。当然torch内部似乎是用了contiguous函数去做了些矩阵结构的调整（从GitHub issue中看到），具体实现细节倒没有去看。

玉扉

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
矩阵中行向量两两之间的欧氏距离

矩阵之间的行向量两两距离给定数据矩阵A∈Rn×dA\in R^{n\times d}A∈Rn×d和矩阵B∈Rm×dB\in R^{m\times d}B∈Rm×d ，A和B中每一行都是一个数据点，现在要去求A中所有元素和B中所有元素之间的欧氏距离。即计算矩阵D=(dij=∣∣ai,:−bj,:∣∣)∈Rn×mD =(d_{ij} = ||a_{i,:} - b_{j, :}||) \in R^{n\times m}D=(dij=∣∣ai,:−bj,:∣∣)∈Rn×m。直接去做n×mn\times
复制链接

扫一扫