CSAPP第五章家庭作业参考答案

本文提供了CSAPP(深入理解计算机系统)第三版第五章的家庭作业解答,包括5.14和5.16题的循环展开版本解析。针对5.14题,解释了6*1循环展开标量版本的CPE(每周期指令)无法低于1.00的原因,以及5.16题中如何通过10*10并行累计方式来接近机器的吞吐量限制。
摘要由CSDN通过智能技术生成

(CSAPP第三版系列)导航篇传送门


5.14编写5.13的6*1循环展开版本

代码如下:

/* Inner product. Accumulate in temporary */
void inner4(vec_ptr u,vec_ptr v,data_t *dest)
{
    long i;
    long length = vec_length(u);
    long limit = length - 5;
    data_t *udata = get_vec_start(u);
    data_t *vdata = get_vec_start(v);
    data_t sum = (data_t)0;

    for(i = 0;i < limit;i = i + 6)
    {
        sum = sum + udata[i] * vdata[i];
        sum = sum + udata[i+1] * vdata[i+1];
        sum = sum + udata[i+2] * vdata[i+2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值