我有一个二维的数值矩阵。每一行都是一个数据点。在data = np.array(
[[2, 2, 3],
[4, 2, 4],
[1, 1, 4]])
现在,如果我的测试点是一个一维numpy数组,比如:
^{pr2}$
我可以做一些简单的事情,比如np.sqrt(np.sum((test-data)**2,axis=1))来计算测试点相对于所有三个数据点的距离。在
但是,如果测试本身是要测试的二维点数组,那么上面的方法就行不通了,我一直在使用类似的方法:test = np.array([[2,3,3],[4,1,2]])
for i in range(len(test)):
print np.sqrt(np.sum((test[i]-data)**2,axis=1))
>>> [ 1. 2.44948974 2.44948974]
[ 2.44948974 2.23606798 3.60555128]
以便根据数据集中的所有点计算测试集中的每个点。似乎应该有一种方法来矢量化整个运算,这样我就可以得到一个(2,3)矩阵,对应的距离返回,而不需要外部FOR循环
(注:虽然这个例子是关于欧几里德距离的,但我发现自己也有类似的类型运算,我想用另一个矩阵的单个元素对一个矩阵的所有元素执行一个操作,所以我希望有一种通用的方法来使用Numpy来设置这种性质的问题。)