优化程序性能

基本策略

  • 高级设计。为遇到的问题选择合适的算法和数据结构。
  • 基本编码原则。避免限制优化的因素,这样编译器就能产生高效的代码。
    1. 消除连续的函数调用。在可能时,将计算移到循环外。
    2. 消除不必要的内存引用。引入临时变量来保存中间结果。
  • 低级优化。结构化代码以利用硬件功能。
    1. 展开循环,降低开销。
    2. 通过使用例如多个累积变量和重新结合技术,找到方法提高指令级并行。
    3. 用功能性的风格重写条件操作。

程序优化的第一步就是消除不必要的工作,让代码尽可能有效地执行所期望的任务。

程序优化的第二步就是利用处理器提供的指令级并行能力,同时执行多条指令。

一、消除不必要的工作

  • 消除循环的低效率
  • 减少过程调用
  • 消除不必要的内存引用

消除循环的低效率

方法:代码移动
识别要执行多次(例如在循环里)但是计算结果不会改变的计算,将计算移动到代码前面不会被多次求值的部分。

/* 低效代码段*/
void lower(char *s){
	long i;
	for (i = 0; i < strlen(s); i++){
		if (s[i] >= 'A' && s[i] <= 'Z')
			s[i] -= ('A' - 'a');
	}
}

/* 代码移动:将strlen函数放到循环体外*/
void lower(char *s){
	long i;
	long len = strlen(s);
	for (i = 0; i < len; i++){
		if (s[i] >= 'A' && s[i] <= 'Z')
			s[i] -= ('A' - 'a');
	}
}

减少过程调用

消除不必要的内存引用

二、利用处理器提供的指令级并行能力

  • 循环展开
  • 提高并行性

循环展开

循环展开是一种程序变换,通过增加每次迭代计算的元素数量,减少循环的迭代次数。

提高并行性

方法:
1. 多个累积变量
对于一个可结合和可交换的合并运算来说,可以通过将一组合并运算分割成两个或更多部分,并在最后合并结果来提高性能。
2. 重新结合变换
通过小括号重新变换合并顺序,从而提高处理器的并行能力。

acc = (acc OP data[i]) OP data[i+1];

/*重新结合变换后:*/
acc = acc OP (data[i] OP data[i+1]);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wshinng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值