numba优化踩坑记录

GIS跳闸

已于 2023-02-19 21:27:30 修改

阅读量1k

点赞数 3

文章标签： python numpy 开发语言

于 2022-10-10 21:14:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46184072/article/details/127252165

版权

起因

众所周知，python的运行很慢。最近遇到一个需要中等频率处理百亿条数据的工作（还没办法直接用numpy的矩阵操作）。但我c++水平有限，加上读取、处理数据的API（ArcPy）只支持python，所以不得不想办法优化运行速度。自然而然地想到了被很多人吹得神乎其技的numba。

快不起来？

numba只能让基于numba数组的操作变快。如果使用python原生的列表进行赋值、计算等操作，甚至会更慢。

numba运行报错？

numba快，确实快，但是想让他能运行起来，就要大幅改变在python中的写法。

尽可能使用局部变量

如果在装饰了@numba.jit(nopython=True)的函数使用了外部定义的全局变量，一不小心就报错。写到最后，我是把要用到的所有变量，都以参数的形式传入了numba优化函数。

替换数据结构

如果以写python的思路写有numba参与的代码，分分钟报错，主要原因是numba不支持大量python内置函数及内置数据结构。大量数据结构需要用numba.types中的数据结构代替。

numba不支持字典结构，需要使用numba.types.Dict代替。numba.types包含了大量用于替换Python原生数据结构的数据结构。
numba不支持大量的Python内置函数。甚至连int()都不支持！

变量是静态类型的

用numba写Python代码，要持着写C/C++的思维才行。

如果在装饰了@numba.jit(nopython=True)的函数中创建了新的numpy数组，一定注意：赋值时，所赋值的类型必须和numpy数组的类型一致，似乎不存在任何的自动类型转换（至少我没遇到）。这比C/C++的类型检查还严格，C/C++有时候还会帮你做自动类型转换。
使用numba.types中的数据结构初始化变量时，要像在C/C++中那样，声明变量的类型。

让numba更快

这其实算是让numpy的内容。我一开始使用了np.append函数去拼接numpy数组。但后来发现，一开始直接声明numpy数组的大小，并用索引赋值，比使用np.append快了不知道多少倍。

欢迎交流~

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
numba优化踩坑记录

使用numba进行python运行速度优化的踩坑经历
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

GIS跳闸 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。