深入理解计算机系统 CSAPP 家庭作业6.45

 CS:APP3e, Bryant and O'Hallaron 可以参考这里

void bijk(array A, array B, array C, int n, int bsize) {
	int i, j, k, kk, jj;
	double sum;
	int en = bsize*(n/bsize);
	for (i = 0; i < n; i++)
		for (j = 0; j < n; j++)
			C[i][j] = 0.0;

	for (kk = 0; kk < en; kk += bsize) {
		for (jj = 0; jj < en; jj += bsize) {
			for (i = 0; i < n; i++) {
				for (j = jj; j < jj + bsize; j++) {
					sum = C[i][j];
					for (k = kk; k < kk + bsize; k++) {
						sum += A[i][k] * B[k][j];
					}
					C[i][j] = sum;
				}
			}
		}
	}
}

先来谈一下参考资料内bijk函数中的blocking技术吧,和题目的两层嵌套循环不同, bijk函数是五层的嵌套 作为人类似乎很难去理解为啥我就处理个矩阵,要整它五层嵌套,完了它还对性能有好处.

你想象一下transpose函数中如果dim=9999999999999...时,这世界不会存在一个cache能存下这个数组,假设此时cache就只有bsize*bsize(bsize<dim)大小,写完一列bsize个dst后就开始写下一列dst这样只有第一列是不命中的,其他bsize-1列都是命中的.

for (k = kk; k < kk + bsize; k++)

bijk函数中 k<kk+bsize就是控制程序写完一个bsize 后就开始写下一列.

这就是blocking技术的核心了.

我们现在开始改transpose函数:

#include <stdio.h>



void transpose(int *dst, int *src, int n, int bsize) {  
	// n为数组大小(假设是方阵的边长), bsize为块大小, bsize宜接近高速缓存大小  
	int i, j, kk, jj;  
	// 处理能够完整被块大小分割的部分  
	for (kk = 0; kk < n; kk += bsize) { // 注意这里应该使用n而不是en  
		for (jj = 0; jj < n; jj += bsize) { // 同上  
			for (i = kk; i < kk + (kk + bsize < n ? bsize : n - kk); i++) { // 确保不越界  
				for (j = jj; j < jj + (jj + bsize < n ? bsize : n - jj); j++) { // 确保不越界  
					// 计算一维数组中的索引  
					int src_index = i * n + j;  
					int dst_index = j * n + i;  
					dst[dst_index] = src[src_index]; // 复制元素
				}  
			}  
		}  
	}  
}

int main() {
	int dim=500;
	int src[dim][dim];
	int dst[dim][dim];
	int i, j;
//给数组赋值
	for (i = 0; i < dim; i++)
		for (j = 0; j < dim; j++)
			src[i][j] = i+j;
//转置
	transpose(dst,src,dim,500);
//检查转置后的结果
	for (i = 0; i < dim; i++)
		for (j = 0; j < dim; j++){
			if(src[i][j]!=dst[j][i])
				printf("转置出错\n");
			}

	return 0;
}

  • 30
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值