分支预测和预测错误惩罚

分支预测和预测错误处罚

现代处理器工作远超当前只在执行的指令,流水线操作并行处理了取指、译码、写回、执行、访存、更新PC等
指令遵循简单的顺序,当遇到分支时,处理器需要猜测分支执行方向,如果选择错误,会导致预测错误处罚(PC上大约19个指令周期)
分支预测需要遵循以下原则

不要过分关心可预测的分支

如分支可预测的,如combine2到combine3,get_vec_start取出后,效率基本没变,因为分支高度可预测,性能基本没变化
修改combin4,加入边界检查如下:
void combin4(vec_ptr v, data_t *dest)
{
	long i;
	long length = vec_length(v);
	data_t *data = get_vec_start(v);
	data_t acc = IDENT;
	
	for (i=0; i<length; i++)
	{
		acc = acc OP data[i];
	}
	*dest = acc;
}
修改为:
void combin4b(vec_ptr v, data_t *dest)
{
	long i;
	long length = vec_length(v);
	data_t acc = IDENT;
	
	for (i=0; i<length; i++)
	{
		if (i >= 0 && i < v->len)
			acc = acc OP data[i];
	}
	*dest = acc;
}
对比结果:
| 函数     | 方法             整数                | 浮点              |
| ------- | -------------- | ------------------ | ----------------- |
|         |                | +                * | +              *  |
| combin4 | 无边界检查    	| 1.27       3.01    | 3.01        5.01  |
| combin4b| 有边界检查    	| 2.02       3.01    | 3.01        5.01  |
可以看出,对于整数有一点系统开销,其他都一样到,因为分支高度可预测

书写适合用条件传输实现的代码

程序中可能有分支完全无法预测,依赖于数据任意特性,此时,如果编译器能够使用条件数据传送而不是条件控制代码,
可以极大提高效率
GCC有两种代码风格:
1:功能性风格————条件传送
2:命令式风格————条件语句有选择更新程序状态
如下代码(比较数据a和b中位置i的数据大小,将小的给a[i],大的给b[i]):
//命令式风格
void minmax1(long a[],long b[], long n)
{
	long i;
	for (i=0; i<n; i++)
	{
		if (a[i] > b[i])
		{
			long t = a[i];
			a[i] = b[i];
			b[i] = t;
		}
	}
}
//对随机数测试,CPE周期大约为13.5,如果可预测的数据,CPE为2.5~3.5,预测惩罚约20周期

//功能式风格
void minmax2(long a[],long b[], long n)
{
	long i;
	for (i=0; i<n; i++)
	{
		long min = a[i] < b[i] ? a[i] : b[i];
		long max = a[i] < b[i] ? b[i] : a[i];
		a[i] = min;
		b[i] = max;
	}
}
测试表明,无论数据是否随机,CPE大约都是4.0
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

技术的微光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值