前言
距离上次发操作系统相关的文章,已经过去了快一周,这一周时间里面,我在疯狂地尝试修复《操作系统真象还原》中出现的bug,但是,一周过去了,我还是没能完成第七章,因此,我做出了一个决定,那就是把它暂时放下,转向我上个学期完成了前三个实验了的CSAPP,至少他不会卡我一周吧……
下载资料
点这里
解压下来之后,根据教程使用一个名叫valgrind的东西,它会生成很多模拟的指令,应该是用来检查程序是否成功用的。
Part A
具体的细节我就不多说了,这一部分不是很难,我就把其他同学的代码看懂了,没有自己实现,大家可以看下知乎上的几篇,都写得很好。在debug的时候,要注意如果使用了<math.h>,在编译时加入-lm。
Part B
32 X 32
通过计算地址得出,每8行会出现一次抢占的情况,所以将原矩阵分成一个个 8 X 8 的块。
但是只是如此还是拿不了满分,为了减少eviction,再利用局部变量存储A中的元素:
if (M == 32) {
int i, j, k, l;
int cache[8];
for (i = 0; i < 4; i++) {
for (j = 0; j < 4; j++) {
for (k = 0; k < 8; k++) {
for (l = 0; l < 8; l++) {
cache[l] = A[k + i * 8][l + j * 8];
}
for (l = 0; l < 8; l++) {
B[l + j * 8][k + i * 8] = cache[l];
}
}
}
}
}
64 X 64
因为每行长了一倍,所以每四行会出现冲突,我打算把它划分成4 X 4,但是只能到1600+,还不到满分,最后学习了下大佬的解法,将8 X 8 的块再转换成4 X 4处理:
- 第一轮循环:转移前四行,解决左上角,且本来应该在左下角的暂时存在右上角;
- 第二轮循环:转移后四行的前四列,再存储右上角,然后将前四列存入右上角,将右上角存入左下角;
- 第三轮循环:解决右下角;
else if (M == 64)
{
int i, j, x, y;
int x1, x2, x3, x4, x5, x6, x7, x8;
for (i = 0; i < N; i += 8)
for (j = 0; j < M; j += 8)
{
for (x = i; x < i + 4; ++x)
{
x1 = A[x][j]; x2 = A[x][j+1]; x3 = A[x][j+2]; x4 = A[x][j+3];
x5 = A[x][j+4]; x6 = A[x][j+5]; x7 = A[x][j+6]; x8 = A[x][j+7];
B[j][x] = x1; B[j+1][x] = x2; B[j+2][x] = x3; B[j+3][x] = x4;
B[j][x+4] = x5; B[j+1][x+4] = x6; B[j+2][x+4] = x7; B[j+3][x+4] = x8;
}
for (y = j; y < j + 4; ++y)
{
x1 = A[i+4][y]; x2 = A[i+5][y]; x3 = A[i+6][y]; x4 = A[i+7][y];
x5 = B[y][i+4]; x6 = B[y][i+5]; x7 = B[y][i+6]; x8 = B[y][i+7];
B[y][i+4] = x1; B[y][i+5] = x2; B[y][i+6] = x3; B[y][i+7] = x4;
B[y+4][i] = x5; B[y+4][i+1] = x6; B[y+4][i+2] = x7; B[y+4][i+3] = x8;
}
for (x = i + 4; x < i + 8; ++x)
{
x1 = A[x][j+4]; x2 = A[x][j+5]; x3 = A[x][j+6]; x4 = A[x][j+7];
B[j+4][x] = x1; B[j+5][x] = x2; B[j+6][x] = x3; B[j+7][x] = x4;
}
}
}
61 X 67
意想不到的简单,先试了下第一问的 8 X 8,就直接通关了。
else {
int i, j, k, l;
int cache[8];
for (i = 0; i < 67; i += 8) {
for (j = 0; j < 61; j += 8) {
for (k = 0; (k + i < 67) && (k < 8); k++) {
for (l = 0; (l + j < 61) && (l < 8); l++) {
cache[l] = A[k + i][l + j];
}
for (l = 0; (l + j < 61) && (l < 8); l++) {
B[l + j][k + i] = cache[l];
}
}
}
}
}
晒一下最后的总成绩:
总结
CSAPP的实验,还是一如既往地强度大,很开心花了两天时间做完了,预计在20号之前结束CSAPP的学习吧,明天继续加油!