通过矩阵求两个向量集中元素两两之间的欧氏距离(python实现)

最新推荐文章于 2022-07-12 18:02:20 发布

data_rec

最新推荐文章于 2022-07-12 18:02:20 发布

阅读量2k

点赞数

分类专栏：数据挖掘算法

数据挖掘同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

算法

2 篇文章 0 订阅

订阅专栏

在很多算法中都会涉及到求向量欧式距离，例如机器学习中的KNN算法，就需要对由训练集A和测试集B中的向量组成的所有有序对 (Ai,Bi) ,求出 Ai 和 Bi 的欧式距离。这样的话就会带来一个二重的嵌套循环，在向量集很大时效率不高。

这里介绍如何将这一过程用矩阵运算实现。

假设有两个三维向量集，用矩阵表示:

A = [a 11 a 12 a 21 a 22 a 31 a 32]

B = ⎡ ⎣ ⎢ ⎢ ⎢ b 11 b 12 b 13 b 21 b 22 b 23 b 31 b 32 b 33 ⎤ ⎦ ⎥ ⎥ ⎥

要求A，B两个集合中的元素两两间欧氏距离。

先求出 ABT ：

A B T = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ \sum k = 1 3 a k 1 b k 1 \sum k = 1 3 a k 2 b k 1 \sum k = 1 3 a k 1 b k 2 \sum k = 1 3 a k 2 b k 2 \sum k = 1 3 a k 1 b k 3 \sum k = 1 3 a k 2 b k 3 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

然后对 A 和 BT 分别求其中每个向量的模平方，并扩展为2*3矩阵：

A s q = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ \sum k = 1 3 (a k 1) 2 \sum k = 1 3 (a k 2) 2 \sum k = 1 3 (a k 1) 2 \sum k = 1 3 (a k 2) 2 \sum k = 1 3 (a k 1) 2 \sum k = 1 3 (a k 2) 2 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

B s q = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ \sum k = 1 3 (b k 1) 2 \sum k = 1 3 (b k 1) 2 \sum k = 1 3 (b k 2) 2 \sum k = 1 3 (b k 2) 2 \sum k = 1 3 (b k 3) 2 \sum k = 1 3 (b k 3) 2 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

然后：

A s q + B s q - 2 A B T = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ \sum k = 1 3 (a k 1 - b k 1) 2 \sum k = 1 3 (a k 2 - b k 1) 2 \sum k = 1 3 (a k 1 - b k 2) 2 \sum k = 1 3 (a k 2 - b k 2) 2 \sum k = 1 3 (a k 1 - b k 3) 2 \sum k = 1 3 (a k 2 - b k 3) 2 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

将上面这个矩阵一开平方，就得到了A，B向量集两两间的欧式距离了。

下面是python实现：

import numpy
def EuclideanDistances(A, B):
    BT = B.transpose()
    vecProd = A * BT
    SqA =  A.getA()**2
    sumSqA = numpy.matrix(numpy.sum(SqA, axis=1))
    sumSqAEx = numpy.tile(sumSqA.transpose(), (1, vecProd.shape[1]))    
    SqB = B.getA()**2
    sumSqB = numpy.sum(SqB, axis=1)
    sumSqBEx = numpy.tile(sumSqB, (vecProd.shape[0], 1))    
    SqED = sumSqBEx + sumSqAEx - 2*vecProd   
    ED = (SqED.getA())**0.5
    return numpy.matrix(ED)

data_rec

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
通过矩阵求两个向量集中元素两两之间的欧氏距离(python实现)

在很多算法中都会涉及到求向量欧式距离，例如机器学习中的KNN算法，就需要对由训练集A和测试集B中的向量组成的所有有序对(Ai,Bi),求出Ai和Bi的欧式距离。这样的话就会带来一个二重的嵌套循环，在向量集很大时效率不高。这里介绍如何将这一过程用矩阵运算实现。假设有两个三维向量集，用矩阵表示: A=[a11a12a21a22a31a32]B=⎡⎣⎢⎢⎢b11b12b13b
复制链接

扫一扫

专栏目录