CSAPP Data Lab

Lordaeron_ESZ

已于 2024-09-01 15:38:27 修改

阅读量809

点赞数 15

文章标签： c语言 unix

于 2024-09-01 15:37:47 首次发布

本文链接：https://blog.csdn.net/qq_37409526/article/details/141785140

版权

CSAPP 的第一个 Lab，对应知识点为书中的第 2 章（信息的表示与处理），要求使用受限制的运算符和表达式实现一些位操作。主要分为两个部分：整数部分和浮点数部分。其中整数部分限制较多，比较偏重技巧性，部分题个人认为很有难度。而浮点数部分则比较基础，主要考察对 IEEE 754 标准的熟悉程度，代码较长，但思路相对简单。

bitXor

思路

使用德-摩根定律进行推导，推导过程如下：

请添加图片描述

代码

int bitXor(int x, int y) {
    // 德-摩根定律
    return ~(~(x & ~y) & ~(~x & y));
}

tmin

思路

最小整数即最高位（负数权重）为 1，其余（正数权重）为 0。

代码

int tmin(void) {
    return 1 << 31;
}

isTmax

思路

由于不能使用左移运算符，因此没办法直接构造出 tmax，需要仔细考虑 tmax 的性质：tmax = 0x7fffffff ，而 tmax + 1 = 0x80000000 ，这两个数的二进制位完全互补，因此满足：tmax + tmax + 1 = 0xffffffff，结果全为 1，对该结果取反即可得到 0，取非得到 1。

但这里还要考虑一个特殊情况：当 x = 0xffffffff 时，x + 1 + x 也满足等于 0xffffffff，因此需要借助异或运算进行特判。

代码

int isTmax(int x) {
    int case1 = !((x + 1) ^ 0);  // case = x == 0xffffffff ? 1 : 0;
    return !(~(x + 1 + x)) & !case1;
}

allOddBits

思路

首先构造一个掩码 mask，奇数位全为 1，偶数位全为 0。将 mask 与 x 进行按位与，如果 x 的奇数位全为 1，那么按位与的结果仍然为 mask。然后便可以借助异或和非的组合，将结果转换为 0 或 1。

代码

int allOddBits(int x) {
    int mask = 0xaa;            // mask = 0x000000aa
    mask = (mask << 8) | 0xaa;  // mask = 0x0000aaaa
    mask = (mask << 8) | 0xaa;  // mask = 0x00aaaaaa
    mask = (mask << 8) | 0xaa;  // mask = 0xaaaaaaaa
    return !((x & mask) ^ mask);
}

negate

思路

补码表示法的重要特性，取反加一即可。

代码

int negate(int x) {
    return ~x + 1;
}

isAsciiDigit

思路

这里我用了比较笨的逐位判断的方法。首先判断第 4 到第 31 位是否为 0x3，然后只需要关注低 4 位的二进制表示了：若第 3 位为 0，则一定位于指定范围之内，再加上两个特例（1000 和 1001）即可。

最后将运算符的个数刚好卡在 15 个，勉强过关。

代码

int isAsciiDigit(int x) {
    // 0011 0000 <= x <= 0011 1001
    int high = !((x >> 4) ^ 0x3);         // 4 ~ 31 位是否为 0x3
    int case1 = ((x & 0xf) >> 3) ^ 0x1;   // bit3 = 0
    int case2 = !((x & 0xf) ^ 0x8);       // bit0~3 = 1000
    int case3 = !((x & 0xf) ^ 0x9);       // bit0~3 = 1001
    return high & (case1 | case2 | case3);
}

conditional

思路

很容易想到根据 x 的值是否非 0 构造出全 0 或者全 1 的数据 flag，然后将 flag 和 flag 取反后的值分别与 y 和 z 进行按位与，这样必然得到两个数：一个为 y 或 z 本身，另一个为 0，再将结果按位或即可。

构造的方法比较巧妙，需要注意到全 0 和全 1 分别代表整数 0 和 -1，它们分别是 0 和 1 的相反数，而 0 和 1 我们可以根据表达式是否非 0，使用非运算符构造出来，再将构造的结果取反加一即可。

代码

int conditional(int x, int y, int z) {
    int flag = ~(!x) + 1;     // flag = x ? 0 : -1;
    int yp = ~flag & y;       // flag = 0, yp = y; flag = -1, yp = 0;
    int zp = flag & z;        // flag = 0, zp = 0; flag = -1, zp = z;
    return yp | zp;
}

isLessOrEqual

思路

判断两个数的大小关系，很容易想到使用作差的方法，判断 x + ~y + 1 的结果是否小于等于 0，即全为 0 或者最高位为 1。

不过这里还需要考虑溢出：由于同号相减必定不会导致溢出，因此我们只需要考虑异号的情况。而如果两个数异号，那它们之间的大小关系就显而易见了。

代码

int isLessOrEqual(int x, int y) {
    int sign1 = ((x >> 31) & 1) & ((y >> 31) ^ 1);  // sign1 = (x < 0 && y > 0) ? 1 : 0;
    int sign2 = ((x >> 31) ^ 1) & ((y >> 31) & 1);  // sign2 = (x > 0 && y < 0) ? 1 : 0;
    int z = x + ~y + 1;                             // z = x - y
    int sub = !(x ^ y) | ((z >> 31) & 1);           // z <= 0    
    return (sub | sign1) & !sign2;
}

logicalNeg

思路

这题从二进制位的角度不好思考，不妨从其表示的十进制数的角度出发：

当 x = 0 时，-x = x ，即 x 和 -x 的最高位相同，都为 0；当 x != 0 时，x 和 -x 的最高位必定有一个为 1。

可以利用这一特性将 x | nx 右移 31 位，由于整数进行的是符号右移，因此当最高位为 0 时，右移的结果全为 0，当最高位为 1 时，右移的结果全为 1。再将右移结果加 1，即可构造出 1 或者 0，且刚好与零和非零对应。

代码

int logicalNeg(int x) {
    int nx = ~x + 1;
    return ((x | nx) >> 31) + 1;
}

howManyBits

思路

这题看到限制 90 个运算符就给吓着了，实际上也确实很困难，自己想了半天也没有思路，于是在网上参考了别人的解法，感觉相当精妙，在这里介绍一番：

对于正整数 x 而言，可以使用二分搜索的方式来确定所需的位数。首先判断 x 是否需要 16 位来表示，即 x 右移 16 位是否为 0，如果是，则右移 16 位，否则不做处理，然后再判断是否需要 8 位来处理，以此类推。最后将上述过程中的右移次数累加起来再加一（正整数首位需要为 0），即为总共需要的位数。

对于负整数 x 而言，它所需的位数与 x 取反得到的整数所需位数相同，证明没整明白。。。

代码

int howManyBits(int x) {
    int absx = (x >> 31) ^ x;
    int b16, b8, b4, b2, b1, b0;

    // 二分搜索
    b16 = (!!(absx >> 16)) << 4;
    absx = absx >> b16;
    b8 = (!!(absx >> 8)) << 3;
    absx = absx >> b8;
    b4 = (!!(absx >> 4)) << 2;
    absx = absx >> b4;
    b2 = (!!(absx >> 2)) << 1;
    absx = absx >> b2;
    b1 = (!!(absx >> 1));
    absx = absx >> b1;
    b0 = absx;

    return b16 + b8 + b4 + b2 + b1 + b0 + 1;
}

floatScale2

思路

这题主要是要对规格化数和非规格化数进行分类讨论：

当 uf 为规格化数，即阶码不为 0 时，乘二相当于将阶码位加 1。

当 uf 为非规格化数，即阶码为 0 时，此时 uf 的值完全由尾数来表示，且不含隐含 0，因此乘二相当于将尾数乘二，即左移 1 位。

需要注意的是，当 uf 为非规格化数且尾数最高位为 1 时，尾数左移会导致最高位的 1 移动到阶码的最低位。但经过验证，此时的结果仍然符合预期，即非规格化数无缝衔接到了规格化数，不禁感叹 IEEE 754 标准浮点数的设计之精妙。

代码

unsigned floatScale2(unsigned uf) {
    unsigned t = (uf >> 23) & 0xff;  // 阶码
    unsigned m = uf & 0x7fffff;      // 尾数
    if (t == 0xff) return uf;        // 无穷大或者 NaN
    // 非规格化数
    if (t == 0x00) {
        m <<= 1;
        uf &= 0xff800000;
        uf |= m;
    }
    // 规格化数
    else {
        t += 1;
        uf &= 0x807fffff;
        uf |= (t << 23);
    }
    return uf;
}

floatFloat2Int

思路

首先确定整数所能表示的上下界的值：当阶码小于 127，即指数位小于 0 时，此时浮点数 uf 小于 1，对应的整数为 0；当阶码大于 150，即指数位大于 23 时，此时单精度浮点数的精度（尾数长度）不足以正确表示对应的整数，返回 0x80000000。

对于在合理范围内的 uf，将其转换为对应的整数，首先需要尾数最高位的高一位加上规格化数隐含的 1，再根据阶码的大小将尾数进行右移，阶码越大，右移位数越少。最后根据符号位的值选择是否将结果取反加一。

代码

int floatFloat2Int(unsigned uf) {
    unsigned s = (uf >> 31) & 0x1;   // 符号
    unsigned t = (uf >> 23) & 0xff;  // 阶码
    unsigned m = uf & 0x7fffff;      // 尾数
    int val;
    // 小于 1
    if (t < 127) {
        val = 0;
    }
    // 大于 1 且不溢出
    else if (t <= 150) {
        val = m | 0x800000;
        val >>= (23 - (t - 127));
        if (s == 1) {
            val = ~val + 1;
        }
    }
    // 溢出
    else {
        val = 0x80000000;
    }
    return val;
}

floatPower2

思路

同样是对规格化数和非规格化数的分类讨论：

当 x >= -150 && x < -127 时，结果为非规格化数，此时浮点数表示只有一个位为 1，其余全为 0。直接根据指数 x 的值确定该位的位置即可。

当 x >= -127 && x < 128 时，结果为规格化数，此时浮点数表示的尾数全为 0，只有阶码用来表示指数的值。根据指数 x 的值确定阶码的值，然后构造出浮点数即可。

代码

unsigned floatPower2(int x) {
    unsigned val;
    // 太小
    if (x < -150) {
        val = 0;
    }
    // 非规格化数
    else if (x < -127) {
        val = 1 << (150 + x);
    }
    // 规格化数
    else if (x < 128) {
        unsigned t = x + 127;
        val |= (t << 23);
    }
    // 太大
    else {
        val = 0x7f800000;
    }
    return val;
}

Lordaeron_ESZ

关注

15
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
CSAPP Data Lab

tags:- 计算机基础- 位运算- 经验categories: 计算机基础CSAPP 的第一个 Lab，对应知识点为书中的第 2 章（信息的表示与处理），要求使用受限制的运算符和表达式实现一些位操作。主要分为两个部分：整数部分和浮点数部分。其中整数部分限制较多，比较偏重技巧性，部分题个人认为很有难度。而浮点数部分则比较基础，主要考察对 IEEE 754 标准的熟悉程度，代码较长，但思路相对简单。more。
复制链接

扫一扫