转帖](译)MATLAB代码矢量化指南-1

发信人: Mars (FangQ), 信区: MathTools
标  题: (译)MATLAB代码矢量化指南-coolor@SMTH[转载]
发信站: 达摩BigGreen BBS (Mon Nov 11 13:54:55 2002), 站内信件

发信人: coolor (2003之春倒计时), 信区: MathTools      
标  题: (译)MATLAB代码矢量化指南
发信站: BBS 水木清华站 (Tue Nov 12 00:43:16 2002), 站内

本文节译自http://www.mathworks.com/support/tech-notes/
1100/1109.shtml
Revison: 2.0 Last Date Modified: 15-October-2002
 
翻译:coolor@smth
感谢:smth2008@smth提供他的译稿。本文多处参考或引用他的译文
========================================================= 
一、基本技术
    -----------------------------------------------------
    1)MATLAB索引或引用(MATLAB Indexing or Referencing)
      在MATLAB中有三种基本方法可以选取一个矩阵的子阵。它们分别是
      下标法,线性法和逻辑法(subscripted, linear, and logical)。
      如果你已经熟悉这个内容,请跳过本节
 
    1.1)下标法
    非常简单,看几个例子就好。
    A = 6:12;
    A([3,5])
    ans =
         8 10
    A([3:2:end])
    ans =
         8 10 12
 
    A = [11 14 17; ...
        12 15 18; ...
        13 16 19];
    A(2:3,2)
    ans =
         15
         16
 
    1.2)线性法
    二维矩阵以列优先顺序可以线性展开,可以通过现行展开后的元素序号
    来访问元素。
    A = [11 14 17; ...
        12 15 18; ...
        13 16 19];
    A(6)
    ans =
         16
 
    A([3,1,8])
    ans =
         13 11 18
    A([3;1;8])
    ans =
         13
         11
         18
 
    1.3)逻辑法
    用一个和原矩阵具有相同尺寸的0-1矩阵,可以索引元素。在某个
    位置上为1表示选取元素,否则不选。得到的结果是一个向量。
    A = 6:10;
    A(logical([0 0 1 0 1]))
    ans =
         8 10
    A = [1 2
         3 4];
    B = [1 0 0 1];
    A(logical(B))
    ans =
       1     4
    -----------------------------------------------------
    2)数组操作和矩阵操作(Array Operations vs. Matrix Operations)
    对矩阵的元素一个一个孤立进行的操作称作数组操作;而把矩阵视为
    一个整体进行的运算则成为矩阵操作。MATLAB运算符*,/,/,^都是矩阵
    运算,而相应的数组操作则是.*, ./, ./, .^
    A=[1 0 ;0 1];
    B=[0 1 ;1 0];
    A*B % 矩阵乘法
    ans =
       0     1
       1     0
    A.*B        % A和B对应项相乘
    ans =
       0     0
       0     0
    ------------------------------------------------------
    3)布朗数组操作(Boolean Array Operations)
    对矩阵的比较运算是数组操作,也就是说,是对每个元素孤立进行的。
    因此其结果就不是一个“真”或者“假”,而是一堆“真假”。这个
    结果就是布朗数组。
    D = [-0.2 1.0 1.5 3.0 -1.0 4.2 3.14];
    D >= 0
    ans =
       0 1 1 1 0 1 1
    如果想选出D中的正元素:
    D = D(D>0)
    D =
      1.0000    1.5000    3.0000    4.2000    3.1400
    除此之外,MATLAB运算中会出现NaN,Inf,-Inf。对它们的比较参见下例
    Inf==Inf返回真
    Inf<1返回假
    NaN==NaN返回假
    同时,可以用isinf,isnan判断,用法可以顾名思义。
    在比较两个矩阵大小时,矩阵必须具有相同的尺寸,否则会报错。这是
    你用的上size和isequal,isequalwithequalnans(R13及以后)。
    ------------------------------------------------------
    4)从向量构建矩阵(Constructing Matrices from Vectors)
    在MATLAB中创建常数矩阵非常简单,大家经常使用的是:
    A = ones(5,5)*10
    但你是否知道,这个乘法是不必要的?
    A = 10;
    A = A(ones(5,5))
    A =
     10 10 10 10 10
     10 10 10 10 10
     10 10 10 10 10
     10 10 10 10 10
     10 10 10 10 10
    类似的例子还有:
    v = (1:5)';
    n = 3;
    M = v(:,ones(n,1))
    M =

     1 1 1
     2 2 2
     3 3 3
     4 4 4
     5 5 5
    事实上,上述过程还有一种更加容易理解的实现方法:
    A = repmat(10,[5 5]);
    M = repmat([1:5]', [1,3]);
    其中repmat的含义是把一个矩阵重复平铺,生成较大矩阵。
    更多详细情况,参见函数repmat和meshgrid。
    -----------------------------------------------------
    5)相关函数列表(Utility Functions)
    ones 全1矩阵
    zeros  全0矩阵
    reshape  修改矩阵形状
    repmat  矩阵平铺
    meshgrid  3维plot需要用到的X-Y网格矩阵
    ndgrid  n维plot需要用到的X-Y-Z...网格矩阵
    filter  一维数字滤波器,当数组元素前后相关时特别有用。
    cumsum  数组元素的逐步累计
    cumprod  数组元素的逐步累计
    eye  单位矩阵
    diag  生成对角矩阵或者求矩阵对角线
    spdiags  稀疏对角矩阵
    gallery  不同类型矩阵库
    pascal  Pascal 矩阵
    hankel  Hankel 矩阵
    toeplitz  Toeplitz 矩阵

==========================================================
二、扩充的例子
    ------------------------------------------------------
    6)作用于两个向量的矩阵函数
    假设我们要计算两个变量的函数F
    F(x,y) = x*exp(-x^2 - y^2)
    我们有一系列x值,保存在x向量中,同时我们还有一系列y值。
    我们要对向量x上的每个点和向量y上的每个点计算F值。换句话
    说,我们要计算对于给定向量x和y的所确定的网格上的F值。
   
    使用meshgrid,我们可以复制x和y来建立合适的输入向量。然后
    可以使用第2节中的方法来计算这个函数。
    x = (-2:.2:2);
    y = (-1.5:.2:1.5)';
    [X,Y] = meshgrid(x, y);
    F = X .* exp(-X.^2 - Y.^2);
    如果函数F具有某些性质,你甚至可以不用meshgrid,比如
    F(x,y) = x*y ,则可以直接用向量外积
    x = (-2:2);
    y = (-1.5:.5:1.5);
    x'*y
    在用两个向量建立矩阵时,在有些情况下,稀疏矩阵可以更加有
    效地利用存储空间,并实现有效的算法。我们将在第8节中以一个
    实例来进行更详细地讨论.
    --------------------------------------------------------
    7)排序、设置和计数(Ordering, Setting, and Counting Operations)
    在迄今为止讨论过的例子中,对向量中一个元素的计算都是独立
    于同一向量的其他元素的。但是,在许多应用中,你要做的计算
    则可能与其它元素密切相关。例如,假设你用一个向量x来表示一
    个集合。不观察向量的其他元素,你并不知道某个元素是不是一
    个冗余元素,并应该被去掉。如何在不使用循环语句的情况下删除
    冗余元素,至少在现在,并不是一个明显可以解决的问题。
   
    解决这类问题需要相当的智巧。以下介绍一些可用的基本工具
   
    max 最大元素
    min 最小元素
    sort        递增排序
    unique      寻找集合中互异元素(去掉相同元素)
    diff        差分运算符[X(2) - X(1), X(3) - X(2), ... X(n) - X(n-1)]
    find        查找非零、非NaN元素的索引值
    union       集合并
    intersect   集合交
    setdiff     集合差
    setxor      集合异或
   
    继续我们的实例,消除向量中的多余元素。注意:一旦向量排序后,
    任何多余的元素就是相邻的了。同时,在任何相等的相邻元素在向量
    diff运算时变为零。这是我们能够应用以下策略达到目的。我们现在
    在已排序向量中,选取那些差分非零的元素。
       
    % 初次尝试。不太正确!
    x = sort(x(:));
    difference = diff(x);
    y = x(difference~=0);
   
    这离正确结果很近了,但是我们忘了diff函数返回向量的元素个数比
    输入向量少1。在我们的初次尝试中,没有考虑到最后一个元素也可能
    是相异的。为了解决这个问题,我们可以在进行差分之前给向量x加入
    一个元素,并且使得它与以前的元素一定不同。一种实现的方法是增
    加一个NaN。
   
    % 最终的版本。
    x = sort(x(:));
    difference = diff([x;NaN]);
    y = x(difference~=0);
   
    我们使用(:)运算来保证x是一个向量。我们使用~=0运算,而不用find
    函数,因为find函数不返回NaN元素的索引值,而我们操作中差分的最
    后元素一定是NaN。这一实例还有另一种实现方式:
   
    y=unique(x);
   
    后者当然很简单,但是前者作为一个练习并非无用,它是为了练习使用
    矢量化技术,并示范如何编写你自己的高效代码。此外,前者还有一个
    作用:Unique函数提供了一些超出我们要求的额外功能,这可能降低代
    码的执行速度。
   
    假设我们不只是要返回集合x,而且要知道在原始的矩阵里每个相异元素
    出现了多少个“复本”。一旦我们对x排序并进行了差分,我们可以用
    find来确定差分变化的位置。再将这个变化位置进行差分,就可以得到
    复本的数目。这就是"diff of find of diff"的技巧。基于以上的讨论,
    我们有:
   
    % Find the redundancy in a vector x

    x = sort(x(:));
    difference = diff([x;max(x)+1]);
    count = diff(find([1;difference]));
    y = x(find(difference));
    plot(y,count)
   
    这个图画出了x中每个相异元素出现的复本数。注意,在这里我们避开了
    NaN,因为find不返回NaN元素的索引值。但是,作为特例,NaN和Inf
    的复本数可以容易地计算出来:
   
    count_nans = sum(isnan(x(:)));
    count_infs = sum(isinf(x(:)));

    另一个用于求和或者计数运算的矢量化技巧是用类似建立稀疏矩阵的方
    法实现的。这还将在第9节中作更加详细的讨论.
    -------------------------------------------------------
    8)稀疏矩阵结构(Sparse Matrix Structures)
   
    在某些情况下,你可以使用稀疏矩阵来增加计算的效率。如果你构造一
    个大的中间矩阵,通常矢量化更加容易。在某些情况下,你可以充分利
    用稀疏矩阵结构来矢量化代码,而对于这个中间矩阵不需要大的存储空
    间。
   
    假设在上一个例子中,你事先知道集合y的域是整数的子集,
    {k+1,k+2,...k+n};即,
    y = (1:n) + k
   
    例如,这样的数据可能代表一个调色板的索引值。然后,你就可以对集
    合中每个元素的出现进行计数(构建色彩直方图?译者)。这是对上一
    节中"diff of find of diff"技巧的一种变形。

   
    现在让我们来构造一个大的m x n矩阵A,这里m是原始x向量中的元素数,
    n是集合y中的元素数。
    A(i,j) = 1 if x(i) = y(j)        
             0 otherwise
   
    回想一下第3节和第4节,你可能认为我们需要从x和y来构造矩阵A。如果
    当然可以,但要消耗许多存储空间。我们可以做得更好,因为我们知道,
    矩阵A中的多数元素为0,x中的每个元素对应的行上只有一个值为1。
   
    以下就是构造矩阵的方法(注意到y(j) = k+j,根据以上的公式):
    x = sort(x(:));
    A = sparse(1:length(x), x+k, 1, length(x), n);
   
    现在我们对A的列进行求和,得到出现次数。
    count = sum(A);
    在这种情况下,我们不必明确地形成排序向量y,因为我们事先知道
    y = 1:n + k.
   
    这里的关键是使用数据,(也就是说,用x控制矩阵A的结构)。由于x在
    一个已知范围内取整数值,我们可以更加有效地构造矩阵。
   
    假设你要给一个很大矩阵的每一列乘以相同的向量。使用稀疏矩阵,不仅
    可以节省空间,并且要比在第5节介绍的方法更加快速. 下面是它的工作
    方式:
    F = rand(1024,1024);
    x = rand(1024,1);
    % 对F的所有行进行点型乘法.
    Y = F * diag(sparse(x));
    % 对F的所有列进行点型乘法.
    Y = diag(sparse(x)) * F;
   
    我们充分利用矩阵乘法算符来执行大规模运算,并使用稀疏矩阵以防止临
    时变量变得太大。
    --------------------------------------------------------
    9)附加的例子(Additional Examples)
    下面的例子使用一些在本技术手册中讨论过的方法,以及其它一些相关方
    法。请尝试使用tic 和toc(或t=cputime和cputime-t),看一下速度加快
    的效果。
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    用于计算数组的双重for循环。
    使用的工具:数组乘法
    优化前:
    A = magic(100);
    B = pascal(100);
    for j = 1:100   
      for k = 1:100;       
        X(j,k) = sqrt(A(j,k)) * (B(j,k) - 1);   
      end
    end
    优化后:
    A = magic(100);
    B = pascal(100);
    X = sqrt(A).*(B-1);
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    用一个循环建立一个向量,其元素依赖于前一个元素
    使用的工具:FILTER, CUMSUM, CUMPROD
    优化前:
    A = 1;
    L = 1000;
    for i = 1:L   
      A(i+1) = 2*A(i)+1;
    end
    优化后:
    L = 1000;
    A = filter([1],[1 -2],ones(1,L+1));   
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    如果你的向量构造只使用加法或乘法,你可使用cumsum或cumprod函数。
    优化前:
    n=10000;
    V_B=100*ones(1,n);
    V_B2=100*ones(1,n);
    ScaleFactor=rand(1,n-1);
    for i = 2:n   
      V_B(i) = V_B(i-1)*(1+ScaleFactor(i-1));
    end
    for i=2:n   
      V_B2(i) = V_B2(i-1)+3;
    end
    优化后:
    n=10000;
    V_A=100*ones(1,n);
    V_A2 = 100*ones(1,n);
    ScaleFactor=rand(1,n-1);
    V_A=cumprod([100 1+ScaleFactor]);
    V_A2=cumsum([100 3*ones(1,n-1)]);
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    向量累加,每5个元素进行一次:
    工具:CUMSUM , 向量索引
    优化前:
    % Use an arbitrary vector, x
    x = 1:10000;
    y = [];
    for n = 5:5:length(x)   
      y = [y sum(x(1:n))];
    end
    优化后(使用预分配):
    x = 1:10000;
    ylength = (length(x) - mod(length(x),5))/5;
    % Avoid using ZEROS command during preallocation
    y(1:ylength) = 0;
    for n = 5:5:length(x)   
      y(n/5) = sum(x(1:n));
    end
    优化后(使用矢量化,不再需要预分配):
    x = 1:10000;
    cums = cumsum(x);
    y = cums(5:5:length(x));
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

    操作一个向量,当某个元素的后继元素为0时,重复这个元素:
    工具:FIND, CUMSUM, DIFF
    任务:我们要操作一个由非零数值和零组成的向量,要求把零替换成为
    它前面的非零数值。例如,我们要转换下面的向量:
    a=2; b=3; c=5; d=15; e=11;
    x = [a 0 0 0 b 0 0 c 0 0 0 0 d 0 e 0 0 0 0 0];
    为:
    x = [a a a a b b b c c c c c d d e e e e e e];
    解(diff和cumsum是反函数):
    valind = find(x);
    x(valind(2:end)) = diff(x(valind));
    x = cumsum(x);  
    >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    将向量的元素累加到特定位置上
    工具:SPARSE
    优化前:
    % The values we are summing at designated indices
    values = [20 15 45 50 75 10 15 15 35 40 10];
    % The indices associated with the values are summed cumulatively
    indices = [2 4 4 1 3 4 2 1 3 3 1];
    totals = zeros(max(indices),1);
    for n = 1:length(indices)   
      totals(indices(n)) = totals(indices(n)) + values(n);
    end
    优化后:
    indices = [2 4 4 1 3 4 2 1 3 3 1];
    totals = full(sparse(indices,1,values));
   
    注意:这一方法开辟了稀疏矩阵的新用途。在使用sparse命令创建稀疏矩阵
    时,它是对分配到同一个索引的所有值求和,而不是替代已有的数值。这称
    为"向量累加",是MATLAB处理稀疏矩阵的方式。
   
========================================================================
=
三、更多资源
    --------------------------------------------------------------
    10)矩阵索引和运算
    下面的MATLAB文摘讨论矩阵索引。它比本技术手册的第1节提供了更加
    详细的信息
    MATLAB Digest: Matrix Indexing in MATLAB
    http://www.mathworks.com/company/digest/sept01/matrix.shtml
   
    下面的说明链接将指导你如何使用MATLAB中的矩阵操作。含括矩阵创建
    、索引、操作、数组运算、矩阵运算以及其它主题。
    MATLAB Documentation: Getting Started
    http://www.mathworks.com/access/helpdesk/help/techdoc/
         learn_MATLAB/learn_MATLAB.shtml
   
    Peter Acklam是我们的一个power user,他建立了一个网页提供MATLAB
    数组处理中的一些技巧。
    Peter Acklam's MATLAB array manipulation tips and tricks
    http://home.online.no/~pjacklam/MATLAB/doc/mtt/index.html
    ---------------------------------------------------------------
    11)矩阵存储管理(Matrix Memory Management)
   
    有关预分配技术如何加快计算速度的更多的信息,参见下面的联机解决方案:

    26623: How do I pre-allocate memory when using MATLAB?
    http://www.mathworks.com/support/solutions/data/26623.shtml
   
    下面的技术手册是关于MATLAB存储管理方面的一个包罗广泛的指南:
    The Technical Support Guide to Memory Management
    http://www.mathworks.com/support/tech-notes/1100/1106.shtml
    ----------------------------------------------------------------
    12)发挥MATLAB的最高性能(Maximizing MATLAB Performance)
   
    这个技术手册对代码矢量化进行一般的讨论,而许多时候,我们的目的是加快

    代码的速度。因此,本节提供一些附加的资源,它们涉及如何是代码达到最高

    性能。
   
    加速代码的常用技巧:
    3257: How do I increase the speed or performance of MATLAB?
    http://www.mathworks.com/support/solutions/data/3257.shtml
   
    编译你的代码并从MATLAB中调用它
    22512: What are the advantages of using the MATLAB Compiler to
    compile my M-files?
    http://www.mathworks.com/support/solutions/data/22512.shtml
   
======================================================================
结论

正如本文所介绍的,针对代码矢量化和代码提速,有一些常规方法,同时,还有
一些非常规方法,正如第9节最后那个例子(对sparse函数进行独特利用)那样。
以上的讨论远没有穷尽MATLAB中所有矢量化技术。它仅仅是代码矢量化的思想和
理论的一个导引。

--

※ 来源:·BBS 水木清华站 smth.edu.cn·[FROM: 166.111.185.48]


--
☆ 来源:.大绿 BBS.Dartmouth.Edu.[FROM: Mars.bbs@bbs.Dartmou]

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
原创Matlab高性能代码编写三内存是要先分配再使用的-MaximizingCodePerformancebyOptimizingMemoryAccess.pdf 我以前写代码常常写出     for n = 1 : xxx         a = fcn     end     后来到处偷师,学了到一定要先开内存,比如用zeros(), 比如换成 for n = xxx : -1 :1      Matlab 在使用内存的时候最有效率的方法是一次找到足够大的连续内存块,而for显然在有些情况下无法满足。 下面写了几个例子。    特别推荐的是         for n = len : -1 :1 的这种for的写法,即不需要zeros() 之类的先开内存,也可以达到预分配内存的效果,当然不知道 是不是某个版本改进之后的效果。 主要的问题来自于matlab的内存管理机制:      对于一个数组,matlab先在内存中找一块放得下的连续空间,如果这个数组一直增大到那个连续空间放不下了, matlab会去找另外一个放得下的连续空间(好像记得在什么地方听到过是找一个原来内存2倍大的地方),这样就带了 两个问题:       1. 额外的操作,找内存 + 复制; 而且这种操作有可能是很多次。       2.  额外的空间,这个时候有2份copy在内存中。导致内存不足的常见原因之一 % Test Part I clear; clc; len = 1000; LOOP = 100; tic; for t = 1 : LOOP     for n = 1 : len         for m = 1:len             x = n*m;         end     end end t1 = toc; clear x; tic; x = zeros; for t = 1 : LOOP     for n = 1 : len         for m = 1:len             x = n * m;         end     end end t2 = toc; clear x; tic; for t = 1 : LOOP     for n = len : -1 : 1         for m = len : -1 : 1             x = n * m;         end     end end t3 = toc; clear x; msg = sprintf; disp; % Test Part II len = 1000; tic; for n = 1 : len  % Loop 1     for i = 1 : len         x*i) =  n*i;     end end t1 = toc; clear x; tic; x = zeros; for n = 1 : len % Loop 2     for i = len: -1 : 1         x*i) =  n*i;     end end t2 = toc; clear x; len = 1000; tic; for n = len : -1 : 1  % Loop 3     for i = len : -1 : 1         x*i) =  n*i;     end end t3 = toc; clear x; msg = sprintf; disp;

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值