主题:减少变量实例化次数有多大作用

在JE上看到了一个帖子讨论下面这种代码的优化问题的:

C代码 复制代码
  1. int main(int argc, char *argv[])   
  2. {   
  3.     int i;   
  4.     for (i = 0; i < 20000; i++) {   
  5.         int j;   
  6.         for (j = 0; j < 2000; j++) {   
  7.             int k;   
  8.             for (k = 0; k < 200; k++);   
  9.         }   
  10.     }   
  11.     return 0;   
  12. }  
int main(int argc, char *argv[])
{
	int i;
	for (i = 0; i < 20000; i++) {
		int j;
		for (j = 0; j < 2000; j++) {
			int k;
			for (k = 0; k < 200; k++);
		}
	}
	return 0;
}



显然是在考查要把循环次数少的放在外层,理由是这样可以减少变量实例话的次数。原理如此,我只是想更加清楚地知道这样做有多大的作用,于是我用gcc的profile工具测试了一下。

把上面的代码用 gcc -pg 编译,profile结果显示整个程序用时32.68秒,多次运行有不到0.1秒的浮动误差。

如果改成

C代码 复制代码
  1. int main(int argc, char *argv[])   
  2. {   
  3.     int i;   
  4.     for (i = 0; i < 200; i++) {   
  5.         int j;   
  6.         for (j = 0; j < 2000; j++) {   
  7.             int k;   
  8.             for (k = 0; k < 20000; k++);   
  9.         }   
  10.     }   
  11.     return 0;   
  12. }  
int main(int argc, char *argv[])
{
	int i;
	for (i = 0; i < 200; i++) {
		int j;
		for (j = 0; j < 2000; j++) {
			int k;
			for (k = 0; k < 20000; k++);
		}
	}
	return 0;
}


用时32.20秒,效率大约提升了1.5%。

以上并没有使用编译器自身的优化选项。下面来看看如果使用了 gcc -O3 (第三级优化)编译会有什么样的结果。
结果表明有很大的改观:前者用时5.07秒,后者用时4.54秒。

如果启用了 -O9 最高级别的优化,后者用时4.60秒,前者用时5.12秒,可见 -O9 并不比 -O3 强。

别忘了这里面的循环要执行 200*2000*20000 = 8000000000,80亿次!即使不用编译器优化,那种被认为是“低效率”的代码也可以32秒多执行完,而那种“高效率”的代码不过把时间减少了1.5%。在实际情况下,调整内外循环顺序可能会严重降低代码的可读性。

而只是简单地加了一个编译器优化,立刻就能把速度提高5倍多。人脑终归不能像编译器一样理解代码。

 

此文转自: http://www.iteye.com/topic/762637

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值