其中x是n*p矩阵,p是向量的维数,n是向量的个数, y是k*n矩阵,k是向量的个数
dist[i][j]
表明x[i]到y[j]距离的平方
def calc_dist(x, y):
(n, p) = x.shape
k = y.shape[0]
x_square = np.tile(np.sum(x*x, keepdims=True, axis=1), (1,k))
y_square = np.tile(np.sum(y*y, keepdims=True, axis=1), (1,n)).T
dist = x_square + y_square - 2*np.matmul(x,y.T)
return dist
x = np.array([[1, 0, 1],[1,1,1]])
y = np.array([[2,1,0],[1,0,1],[1,1,1]])
print(calc_dist(x, y))
输出:
[[3 0 1]
[2 1 0]]
之后看到一个非常fancy的方法:
dist = np.sum(np.power(x - y[:, np.newaxis, ...], 2), axis=2).T
具体的话应用到了Numpy的broadcast机制。我们的目的是给了[a1, a2],和[b1, b2, b3],希望构造:
[[a1-b1 a1-b2 a1-b3]
[a2-b1 a2-b2 a3-b3]]
其中a,b都是(3,)的向量,那么可以用上面的方法。