优化代码,看看哪个执行速度更快!!!

原创 2004年09月01日 08:49:00

优化代码,看看哪个执行速度更快!!!


         最近我编写一个小程序,其用一个函数将 A,B 值互换,因为该函数调用频繁,于是对其优化,以下有三个版本,请试试看Rev1, Rev2, Rev3三个函数哪个执行速度更快。

// Delphi 代码如下:

unit Unit1;

// Created By BHB. 2004-08-31

interface

uses
  Windows, Messages, SysUtils, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls;

type
  TForm1 = class(TForm)
    procedure FormCreate(Sender: TObject);
  private

  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

// 高精度计时
function XTimer(var t0: Int64; bStart: Bool): Int64;
var
  t, fq: Int64;
begin
  QueryPerformanceCounter(t);
  if bStart then
    t0 := t
  else begin
    t := t - t0;
    QueryPerformanceFrequency(fq);
    Result := trunc(t / fq * 1000);
  end;
end;

procedure Rev1(var a, b: Integer);
begin
  asm
    MOV      ECX,   [EDX]
    XCHG     [EAX], ECX
    MOV      [EDX], ECX
  end;
end;

procedure Rev2(var a, b: Integer);
begin
  a := a xor b;
  b := a xor b;
  a := a xor b;
end;

procedure Rev3(var a, b: Integer);
var
  t: Integer;
begin
  t := a;
  a := b;
  b := t;
end;

procedure TForm1.FormCreate(Sender: TObject);
type
  TRevFun = procedure(var a, b: Integer);
var
  S: string;
  a, b: Integer;
  T: Int64;

  procedure Test(const RevName: string; Rev: TRevFun);
  var
    I: Integer;
  begin
    XTimer(T, True);           // 计时开始

    // 一千万次循环
    for I := 0 to 10000000 do Rev(a, b);

    T := XTimer(T, False);     // 计时结束
    S := S + RevName + Format(' 耗时: %d 毫秒.'#13#10, [T]);
  end;

begin
  a := 123;
  b := 321;
  Test('Rev1', Rev1);
  Test('Rev2', Rev2);
  Test('Rev3', Rev3);
  ShowMessage(S);
end;

end.

如果你认为汇编执行速度更快,可能会选 Rev1;
如果你看过优化方面的书,可能会选 Rev2,几乎百分之百的教科书都这样写的,XOR操作速度更快;
如果你刚学计算机,可能会做这个程序练习,Rev3 的方法简单、易理解。

倒底哪个更快呢,以下是不同平台下的执行结果:(值越小速度越快)

AMD Duron 750MHz 执行结果:

P4 2.00GHz 执行结果:

        怎么样出乎意料之外吧, 不管哪种平台, 尽管它们的执行时间长短有差别, 但对应的执行速度都为: Rev3 > Rev2 > Rev1

         Rev1 用汇编指令写的代码在P4机器上执行速度却比最快的 Rev3 慢上近十倍,在AMD机器的表现也慢了近三倍;
         Rev2 是书上的标准答案,异或操作本应更快, 可测试结果却并非如此...
         Rev3 取得了最后的胜利,这足以颠覆我们的惯性思维,最简单的编程方法编出的代码反而执行最快, 其实细想一下, 其实道理也很简单, Rev1 虽然只用三条汇编指令就完成功能,是三个函数中使用汇编语句最少的(其它两个函数都分别用六条汇编指令实现的), 但其中 XCHG 指令执行却颇耗时间, 在P4机器上的表现最为实出; 同理 Rev2 亦是如此, 它没有用到临时变量, 就是两个数的XOR操作, 本应比 Rev3 快, 但实际中却败下阵来, 究其原因也是因为 XOR 操作要比 Rev3 的赋值指令 MOV 要更耗费时间; Rev3 中的虽然用到了一个临时变量用于保存中间值,但一个压栈、弹栈并不会耗用多少时间,其余的汇编指令就是使用MOV,而MOV指令是CPU使用最频的汇编指令,所以厂家对该指令的硬件电路设计上一定会进行更好的优化,故Rev3在最终胜出也就不足为怪了。

优化代码的几个技巧

无意看到一篇小短文,猜测作者应该是一个图形学领域的程序员或专家,介绍了在光线(射线)追踪程序中是如何优化C/C++代码的。倒也有一些参考意义,当然有的地方我并不赞同或者说我也不完全理解,原文在此,我的...
  • casiot
  • casiot
  • 2014-09-15 01:22:19
  • 1773

代码性能优化建议

编写:kesenhoo - 原文:http://developer.android.com/training/articles/perf-tips.html 这篇文章主要介绍一些小细节的优化技巧...
  • lyj1005353553
  • lyj1005353553
  • 2016-12-21 13:46:11
  • 904

数组循环遍历优化和数组去重算法

数组循环优化和数组去重算法
  • vuturn
  • vuturn
  • 2015-03-14 15:40:29
  • 2658

delphi中使用指针优化程序性能

    大多数情况下,dephi高效的编译器能使代码优化,以达到最有效率。但是,大家都知道,决定程序效率的是算法,不论编程语言多好, 计算机性能多高,如果没有合理的算法。随便写出来的程序也是难以胜任复...
  • ljq900
  • ljq900
  • 2006-09-07 19:51:00
  • 959

快速FastPosChar算法(Delphi SSE优化算法应用之一)

应群友cjc要求改写了一个poschar的快速算法,实测速度比系统自带pos要快500%以上,这些都是归功于sse指令集发挥的作用。function CGPosChar(Ch: Char ; SAdd...
  • codegame
  • codegame
  • 2010-07-28 15:48:00
  • 1459

JS代码优化的几种方式

如果你问我网站中最影响网站打开速度的是什么?我会告诉是网站中的javascript,简称JS。模板中引用的JS文件越多,打开速度越慢,这点我深有体会,不信你看看卢松松博客首页,使劲优化后依然有100K...
  • sdfujichao
  • sdfujichao
  • 2016-08-05 20:45:13
  • 2187

系统性能优化的几个方面

系统性能优化的几个方面  很早以前,做管理系统,对性能体会并不是特别明显。因为一些用户非常聪明,会通过调整自己的使用方式来适应系统的处理能力。现在想起来,有环境的原因也有能力的原因,没有做好性能的事情...
  • tenglizhe
  • tenglizhe
  • 2015-03-23 13:41:03
  • 3076

如何写出运行速度更快的代码:硬件篇

介绍 为什么需要更高效的代码 加速的意义 硬件平台 multicore vs manycore Instruction level parallelism SIMD Simultaneous Mult...
  • c602273091
  • c602273091
  • 2017-01-25 11:37:37
  • 1028

关于为什么机器语言执行速度比高级语言快

在网上搜索半天都没有找到满意的答案,今天下午请教了吕老师,他给的答案我觉得还是比较令我信服的 首先第一点,机器语言...
  • zhaoshu01234
  • zhaoshu01234
  • 2014-04-15 17:34:52
  • 1390

【JQuery】优化页面性能的代码技术整理(提高网页响应速度必看)

jQuery是一个非常流行而且实用的JavaScript前端框架,本文并不是介绍jQuery的特效动画,而是分享一些平时积累的12个jQuery实用代码片段,希望对大家有所帮助。 1.导航菜单背景...
  • hj7jay
  • hj7jay
  • 2016-12-02 09:29:32
  • 723
收藏助手
不良信息举报
您举报文章:优化代码,看看哪个执行速度更快!!!
举报原因:
原因补充:

(最多只允许输入30个字)