转载:https://www.douban.com/note/236035787/
相关版本:numpy 1.6 &&1.7 && 1.8
numpy中的矩阵乘法有两个,np.dot(等价于 array.dot,也等价于np.core.dot,还等价于np.core.numeric.dot)和np.core.multiarray.dot,这两个dot是不一样的实验表明这两个dot的计算结果存在着微小的差异
可以尝试运行
a = np.random.rand(10,10)
b = np.random.rand(10,10)
c = np.dot(a,b)
d = np.core.multiarry.dot(a,b)
print np.abs(c-d).sum()
可以看到结果不为0
事实上,参考源代码,np.dot采用了blas-optimized version.
https://github.com/numpy/numpy/blob/master/numpy/core/numeric.py
https://github.com/numpy/numpy/blob/master/numpy/core/blasdot/_dotblas.c
而np.core.multiarray.dot的实现在下面这个文件中
https://github.com/numpy/numpy/blob/master/numpy/core/src/multiarray/multiarraymodule.c
当然,通常情况下我是不会去调用np.core.multiarray.dot的(正常人都应该这样吧)
但是,当我们使用numpy的C-API时,问题就来了,
http://docs.scipy.org/doc/numpy/reference/c-api.array.html#functions 中提供的PyArray_MatrixProduct其实是np.core.multiarray.dot,而不是np.dot,
所以最后的结果会与python版本略有不同。
效率上我没有仔细分析,但直观感觉应该是np.dot快一些,毕竟是blas-optimized。而且PyArray_MatrixProduct内部调用dotfunc都不要求数据在内存里连续存储。
那么,接下来的问题就是,如何在C代码中调用np.dot?