python被称为胶水语言,其优势是能够粘结各种不同的语言。同时,python有着更大的“亲民性”,很容易进行开发。但是,python最大的问题就是计算速度不够。通常可以用CUDA或者C++对一个python程序进行加速,加速策略如下:
1. 大规模算术运算、矩阵运算等过程用底层语言编写,python只负责传参和处理结果数据;
2. 十分常用的函数,我们可以用C++写成“算子”,然后python调用算子即可,如边缘检测的Sobel算子;
1. 无传参情况
C++的函数需要用extern描述才能被Python调用。先建一个名为ct.cpp的c++文件,如下:
#include<iostream>
#include<string>
using namespace std;
extern "C"{
int hehe(){
cout<<"hehe"<<endl;
return 0;
}
}
在Linux环境下编译:
g++ -o ct.so -shared -fPIC ct.cpp
根据上面的编译命令,就可以在同目录下得到名为ct.so的文件了 ,这就是可以被python直接调用的。再来看看python调用的代码:
import ctypes
ll = ctypes.cdll.LoadLibrary
lib = ll('./ct.so')
lib.hehe()
输出为:
hehe
这样就成功实现在无传参情况下python调用C++的函数。
2. 有传参情况
我们编写一个带参数的C++函数,命名为"cm.cpp":
#include<iostream>
#include<string>
using namespace std;
extern "C"{
int cm(int n){
int cm=0;
int i;
for(i=1;i<=n;++i){
cm += i;
}
return(cm);
}
}
这个函数干了啥呢? 你会发现这个函数啥也没干,cm+i又-i。 最后的结果一定是0,但这个函数的计算复杂度是n,算数运算次数的2n次。我编写这个函数是为了检测,同一个函数用C++写和python写,他们的计算速度差异有多大。
import ctypes
from time import time
cpp = ctypes.CDLL('./cm.so')
if __name__ == '__main__':
num = 1000000
s1 = time()
print("cpp result = %d" % cpp.cm(num))
print('cpp time consuming: ', time()-s1)