python求两个点的欧氏距离_比较numpy和pytorch的tensor计算欧氏距离的速度

e6bcd982ffe3c7148663cbc09ad2bcbf.png
封面ano酱

没啥技术含量的东西,只是方便下想查的人和给自己做记录

import numpy as np
import time
import torch
import torch.nn.functional as F


a = np.random.rand(1,1000000)
b = np.random.rand(1,1000000)
c = torch.rand(1,1000000)
d = torch.rand(1,1000000)
e = torch.rand(1,1000000).cuda()
f = torch.rand(1,1000000).cuda()

#计算numpy计算速度
time_start=time.time()
dist1 = np.linalg.norm(a - b)#numpy求欧氏距离
time_end=time.time()
print(time_end-time_start)

#计算tensor在cpu上的计算速度
time_start=time.time()
dist2 = F.pairwise_distance(c, d, p=2)#pytorch求欧氏距离
time_end=time.time()
print(time_end-time_start)

#计算tensor在cuda上的计算速度
time_start=time.time()
dist2 = F.pairwise_distance(e, f, p=2)
time_end=time.time()
print(time_end-time_start)

计算结果:
0.0031995773315429688
0.025923967361450195
0.0006928443908691406

可以看出tensor不挂在cuda上,速度不如numpy。起码在计算欧式距离是如此...


希望能帮到跟我一样入门的兄弟

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
欧氏距离的公式是:d(x,y) = sqrt((x1-y1)^2 + (x2-y2)^2 + ... + (xn-yn)^2) 以下是使用CUDA实现的代码示例: ```C++ #include <stdio.h> #include <stdlib.h> #include <cuda_runtime.h> #define N 1024 __global__ void euclideanDistance(float *x, float *y, float *result) { int tid = blockIdx.x * blockDim.x + threadIdx.x; if (tid < N) { float sum = 0.0f; for (int i = 0; i < N; i++) { float diff = x[i] - y[i]; sum += diff * diff; } result[tid] = sqrt(sum); } } int main() { float *x, *y, *result; cudaMallocManaged(&x, N * sizeof(float)); cudaMallocManaged(&y, N * sizeof(float)); cudaMallocManaged(&result, N * sizeof(float)); // initialize x and y with random values for (int i = 0; i < N; i++) { x[i] = static_cast<float>(rand()) / RAND_MAX; y[i] = static_cast<float>(rand()) / RAND_MAX; } int blockSize = 256; int numBlocks = (N + blockSize - 1) / blockSize; euclideanDistance<<<numBlocks, blockSize>>>(x, y, result); cudaDeviceSynchronize(); // print the result for (int i = 0; i < N; i++) { printf("Distance between x and y[%d] = %f\n", i, result[i]); } cudaFree(x); cudaFree(y); cudaFree(result); return 0; } ``` 在这个示例中,我们使用了CUDA的并行计算能力,通过在GPU上同时计算多个距离来加速计算。首先,我们在GPU上分配了内存用于存储两个向量和计算结果。然后,我们使用随机数初始化了两个向量。接下来,我们将距离计算函数euclideanDistance定义为一个CUDA核函数,在每个线程中计算两个向量之间的距离。最后,我们在主程序中调用这个核函数,并用cudaDeviceSynchronize()等待所有线程完成计算。最后打印结果并释放内存。 请注意,由于这个示例使用了CUDA,因此需要在支持CUDA的GPU上运行。如果您的计算机不支持CUDA,或者您没有安装CUDA,那么您将无法运行这个示例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值