优化代码,看看哪个执行速度更快!!!

优化代码,看看哪个执行速度更快!!!


         最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。

// Delphi 代码如下:

unit Unit1;

// Created By BHB. 2004-08-31

interface

uses
  Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls;

type
  TForm1 = class(TForm)
    procedure FormCreate(Sender: TObject);
  private

  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

// 高精度计时
function XTimer(var t0: Int64; bStart: Bool): Int64;
var
  t, fq: Int64;
begin
  QueryPerformanceCounter(t);
  if bStart then
    t0 := t
  else begin
    t := t - t0;
    QueryPerformanceFrequency(fq);
    Result := trunc(t / fq * 1000);
  end;
end;

procedure Rev1(var a, b: Integer);
begin
  asm
    MOV      ECX,   [EDX]
    XCHG     [EAX], ECX
    MOV      [EDX], ECX
  end;
end;

procedure Rev2(var a, b: Integer);
begin
  a := a xor b;
  b := a xor b;
  a := a xor b;
end;

procedure Rev3(var a, b: Integer);
var
  t: Integer;
begin
  t := a;
  a := b;
  b := t;
end;

procedure TForm1.FormCreate(Sender: TObject);
type
  TRevFun = procedure(var a, b: Integer);
var
  S: string;
  a, b: Integer;
  T: Int64;

  procedure Test(const RevName: string; Rev: TRevFun);
  var
    I: Integer;
  begin
    XTimer(T, True);           // 计时开始

    // 一千万次循环
    for I := 0 to 10000000 do Rev(a, b);

    T := XTimer(T, False);     // 计时结束
    S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);
  end;

begin
  a := 123;
  b := 321;
  Test('Rev1', Rev1);
  Test('Rev2', Rev2);
  Test('Rev3', Rev3);
  ShowMessage(S);
end;

end.

如果你认为汇编执行速度更快,可能会选 Rev1;
如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;
如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。

倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)

AMD Duron 750MHz 执行结果:

P4 2.00GHz 执行结果:

        怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1

         Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;
         Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...
         Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。

阅读更多
个人分类: 软件工程
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭