向量的单位化是指,将向量的每个元素除以向量的模(2-范数),使得向量的模(2-范数)变为1.
在机器学习、压缩感知、稀疏表现等方面,经常需要对矩阵的每个列向量进行单位化。下面对各种列向量单位化的MATLAB代码进行比较。MATLAB版本为R2019a,CPU为Intel i7 8700.
一、两层for循环
先试试最笨的两层for循环。逻辑很接近C的语言逻辑,很容易理解。
function
10000×10000的矩阵列向量单位化,两层for循环仅耗时0.5877秒。比我想象的快的多,MATLAB for循环速度慢在新版MATLAB面前就是个笑话。
二、for循环+sum函数
function
单层for循环+sum函数,居然耗时0.6027秒,比两层for循环还慢,令人震惊!看来MATLAB对for循环的优化已经到了令人发指的地步。
三、for循环+norm函数
norm函数是built-in函数,用于求矩阵、向量的范数,默认是2-范数。注意,矩阵范数与矩阵列向量的范数不是一个概念。
function
单层for循环+sum函数,耗时0.5496秒,优于两层for循环。
四、向量化(右乘对角矩阵)
采用右乘一个对角矩阵的方式对矩阵进行缩放,常见的列向量单位化操作。
function
耗时7.9222秒!!!彻底翻车,大量的时间花费在分配内存生成10000×10000的对角矩阵上,效率低的令人发指!
五、bsxfun + sum函数
虽然Compatible Array Sizes功能已经取代了bsxfun函数,但我仍然喜欢写成bsxfun的形式。
function
耗时0.3529秒。bsxfun一如既往的给力。
六、bsxfun + arrayfun(for)
arrayfun本质上还是for循环,只不过形式更加简洁。
function
耗时0.2949秒!效果非常好。
七、bsxfun + vecnorm
MATLAB 有自带的对矩阵列向量求范数的built-in函数,vecnorm,试一下运行效率如何。(这个函数我也是写文章时才发现的)
function
耗时仅0.1565秒! Amazing
七、不同大小的矩阵测试
function
测试表明,当矩阵
结论:对于小规模矩阵,向量化(fun4)速度最快,理解起来也很方便;中等或大规模矩阵,bsxfun+vecnorm函数(fun7)速度最快.
易夕:MATLAB Tricks 专栏目录zhuanlan.zhihu.com