c++ 向量化_使用向量化、矩阵化、cuda等不同方法加速python程序

本文通过一个计算点云距离的例子,对比了Python中普通方法、向量化、矩阵化和CUDA在加速计算任务上的效果。在i9-9900X CPU和RTX 2080 Ti GPU环境下,详细阐述了如何利用这些方法改进计算效率,并提供了距离计算的数学推导和实现方式。
摘要由CSDN通过智能技术生成

使用向量化、矩阵化、cuda等不同方法加速python程序

第一次写知乎文章,本文中如有错误请不吝赐教,各位大大多多包涵。

本文是一次实验室组会的分享内容,对于机器视觉各类问题中经常需要处理大量计算任务的情况,以一个计算点云距离的例子来观察不同处理方法在python编程中对速度的影响。运行程序的电脑CPU型号:i9-9900X,GPU型号:RTX 2080 Ti ,python版本3.8.1 ,使用Jupyter lab编写。

问题描述:
在python中,使用普通方法、向量化、矩阵化、cuda等方法加速计算两组点云间各点的距离

# 初始化数据
  • 普通方法
    通过嵌套的循环,计算所有点的距离,距离计算公式为:
# 普通计算距离
普通计算时间: 950.3101623058319 s
common_result 
  • 向量化方法
    将数据A以重复m次的方式扩展,数据B以复制的方式扩展,实现A中任一点对B中所有点的对应关系。即:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值