经过一个月的电子邮件与Mathworks的联系人,使用我自己的代码,并以任何方式分析我的代码,我有一个答案;然而,这可能是我不得不提出技术问题的最不满意的答案:
简短版本是“升级到Matlab版本2011a(上周正式发布),此问题现已解决”。
较长版本涉及2010年和更早版本中与mex网关相关联的开销问题。我能够提取的最好的解释是,这个开销不是一次评估,而是每次函数调用一个链接库中的另一个函数时,我们都会付出一点点费用。
虽然为什么这会让我失望,但至少与我所做的SHARK分析一致。当我配置和比较本机应用程序和mex应用程序之间的差异时,会有一个重复的模式。在我为应用程序编写的源代码中的函数中花费的时间不会改变。在本机和mex实现之间进行比较时,在库函数中花费的时间有所增加。用于构建此库的另一个库中的函数会增加差异。随着我们越来越深入到BLAS实施之前,时差不断增加。
几个大量使用的BLAS功能是主要的罪魁祸首。在本机应用程序中花费了我计算时间的大约1%的功能在mex功能中以30%的速度播放。
2010年和2011年之间,mex网关的实施似乎有所改变。在我的Macbook上,本机应用程序大约需要6秒钟,而mex版本需要6.5秒。这是我可以处理的开销。
至于根本原因,我只能推测。 Matlab是解释性编码的根源。由于mex函数是动态库,我猜测每个mex库都不知道直到运行时是链接的。由于Matlab建议用户很少使用mex,只能使用较小的计算密集型数据块,所以我假设很大程序(如ODE求解器)很少被实现。像我这样的节目,是最受苦的节目。
我已经描述了几个Matlab函数,我知道要在C中实现,然后使用mex进行编译(特别是在动力学模型(SimBiology工具箱的一部分)上调用sbioaccelerate之后,sbiosimulate),似乎有一些显着的加速。因此,2011a更新似乎比通常的半年升级更为广泛。
最好的运气给其他编码的同样的问题。感谢所有有用的建议,让我从正确的方向开始。
– 安德鲁