CSAPP复习（信息的表示和处理）

MarcyTheLibrarian

于 2022-10-05 21:03:04 发布

阅读量533

点赞数

分类专栏：知识点文章标签：计算机系统

本文链接：https://blog.csdn.net/twi_twi/article/details/127173934

版权

知识点专栏收录该内容

15 篇文章 1 订阅

订阅专栏

Ⅰ：位、整数

信息的位表示

计算机存储、处理的信息：二值信号
“位” 或 “比特”(bit)：最底层的二进制数字（数码）称为位（bit，比特），值为0或1
位组合：把位组合到一起，采用某种规则进行解读；每个位组合都有含义
字节：8-bit 块

二进制数

位权为2^i
MSB：最高有效位（Most Significant Bit）
LSB：最低有效位（Least Significant Bit）
在这里插入图片描述

十六进制数

位权为16^i
0, 1，2，3，4，5，6，7，8，9，A，B，C，D，E，F

进制转换（自己试一试）

十进制整数转换为k(2、8或16)进制数
- 整数转换：用除法—除基取余法（从下到上）
  十进制数整数部分不断除以基数k(2、8或16) ，并记下余数，直到商为0为止。
  由最后一个余数起，逆向取各个余数，则为转换成的二进制和十六进制数
  126＝01111110B 二进制数用后缀字母B
  126＝7EH 十六进制数用后缀字母H
- 小数转换：用乘法—乘基取整法(从上到下)
  乘以基数k，记录整数部分，直到小数部分为0为止
  0.8125＝0.1101B
  0.8125＝0.DH

定点数与浮点数

定点数：小数点约定在固定位置的数
浮点数：小数点约定为可浮动的数
定点小数用来表示浮点数的尾数部分
定点整数用来表示整数，分带符号整数和无符号整数
$X=(-1)^s\ast M\ast R^E$
S决定符号；M是定点小数，是尾数；E是二进制定点整数，称为阶或指数

位级运算

布尔代数(Boolean Algebra)
&：相与，|：相或，~：取反，^：异或
在这里插入图片描述

Ｃ语言中的移位运算

左移: x << y
将位向量x向左移动y位
逻辑左移和算术左移都是补0
右移: x >> y
将位向量x向右移动y位
逻辑右移：在左边补0
算术右移：复制左边的最高位(y次)

整型数

表示：无符号数和有符号数

无符号数：
$B2U(X)=\sum_{i=0}^{w-1}x_i·2i$

有符号数——补码：
$B2T(X)=-x_{w-1}·2w-1+i=0w-2xi·2i$

无符号数值：
$U M in = 0$
$UMax=2^{w-1}$

补码数值：
$TMin=-2^{w-1}$
$TMax=2^{w-1}-1$

位数 W = 16 时的数值
在这里插入图片描述

不同字长的数值
在这里插入图片描述

机器数
机器数：最高位0表示非负数，1表示负数。
在这里插入图片描述

原码、反码、补码

原码：符号位绝对值
在这里插入图片描述

反码：
正数的反码：与其原码相同。
负数的反码为：其原码中符号位不变，其余各位取反。
在这里插入图片描述

补码
正数的补码与其原码相同。（正数的原码、反码、补码均相同）
负数的补码为：其反码的最低位加1。
在这里插入图片描述

无符号数和有符号数的转换

规则：位模式不变、数值可能改变**(按不同编码规则重新解读)**

在这里插入图片描述

C语言中的有符号数和无符号数
常量：数字默认是有符号数、无符号数用后缀“U”：0U, 4294967259U
类型转换：

显示的强制类型转换
int tx, ty;
unsigned ux, uy;
tx = (int) ux;
uy = (unsigned) ty;
隐式的类型转换（赋值、函数调用等情况下发生）
tx = ux;
uy = ty;

表达式计算
- 表达式中有符号和无符号数混用时：有符号数隐式转换为无符号数
- 包括比较运算符<, >, ==, <=, >=
- 注意下面的第3、5、7、9行
- C语言中的整数（注意带星的）
有符号数和无符号数转换的基本原则
位模式不变
重新解读（按目标编码类型的规则解读）
会有意外副作用: 数值被 + 或 $2^w$

扩展、截断

符号扩展
给定w位的有符号整型数x，将其转换为w+k位的相同数值的整型数
规则：

符号扩展示例
总结：扩展、截断的基本规则

扩展	截断
从short int 到int的转换	从unsigned 到unsigned short的转换
无符号数: 填充0 有符号数:符号扩展结果都是明确的预期值	无论有/无符号数: 多出的位均被截断结果重新解读无符号数: 相当于求模运算有符号数: 与求模运算相似对于小整数，结果是明确的预期值

整数运算：加、非、乘、移位

无符号数加法

标准加法：忽略进位输出
模数加法：相当于增加一个模运算
$s = UAdd_w(x , y) = (x + y)\mod2^w$

$𝑈𝐴𝑑𝑑_𝑤 (x, y) = \begin{cases} {𝑥 + 𝑦 ，𝑥 + 𝑦 < 2^𝑤}\\ {𝑥 + 𝑦 − 2^𝑤 ，𝑥 + 𝑦 ≥ 2^𝑤} \end{cases}$
补码加法
$TAdd(x,y)=\begin{cases} {x+y-2^w，TMax_w<x+y}\\ x+y，TMin_x \leq x+y \leq TMax_w\\ x+y+2^w，x+y<TMin_w \end{cases}$
乘法

乘积的精确结果可能超过w 位
- 无符号数乘法
  $UMult_w(x , y) = x ·y \mod 2^w$
- 有符号数乘法
  丢弃w 位: 保留低w 位
- 用移位实现“乘以2的幂”
  无论有符号数还是无符号数：
  $\space可得到\space u*2^k$
- 用移位实现无符号数“除以2的幂”（逻辑右移）
  $k\space得到\space u / 2^k \space的向下取整$

内存、指针、字符串表示

程序用地址来引用内存中的数据：
内存可看做巨大的“字节数组”、地址就像这个“字节数组”的索引
操作系统为每个进程提供私有的地址空间
每个进程可访问自己地址空间中的内存数据，彼此不干扰。

Ⅱ：浮点数

二进制小数

在这里插入图片描述
表示的有理数:
$\sum^𝑚_{i=-n} 𝑏_𝑖 × 2^𝑖$
只能精确表示形如 x/{2^k}的数值，其他有理数的二进制表示存在重复段

IEEE 浮点数标准: IEEE 754

在这里插入图片描述

规格化数

规格化数的形式
$1.Significand × R^{Exponent}$
32-bit规格化数

S(1 bit)	Exponent(? bit)	Significand(? bit)
符号位	译码（增码、阶码）	部分尾数

精度选项	bits
单精度	32 bits（1+8+23）
双精度	64 bits（1+11+52）
扩展精度	80 bits（1+15+63/64）

阶码(Exp) 采用偏置值编码，阶码的值（阶）：
$E = Exp – Bias\\ Exp: Exponent 字段的编码（无符号数）\\ Bias：偏置 = 2^{k-1} - 1\\ k 为阶码的位数$

$-126…127)\\ 双精度: 1023 (Exp: 1…2046, E: -1022…1023)$

尾数(Significand) 编码隐含先导数值1:
$M = 1.xxx…x_2\\ xxx…x: 是 frac字段的数码\\ frac=000…0 (M = 1.0)时，为最小值\\ frac=111…1 (M = 2.0 – ε)时，为最大值\\ 额外增加了一位的精度（隐含值1）$
规格化编码示例
$15213_{10} = 1.1101101101101_2 * 2^{13}\\ 尾数(Significand):\\ M = 1.1101101101101_2\\ frac = 11011011011010000000000_2\\ 阶码(Exponent)\\ E = 13 =Exp-Bias\\ Bias = 127\\ Exp = 140 = 10001100_2\\ 编码结果:\\ 0\space 10001100\space 11011011011010000000000$
试求：
1 0111101 110000000000000000 的十进制：0.4375
-12.75 的机器数： 1 10000010 100110000000000000000000

非规格化数

$(–1)^s *M* 2^E\\ 阶码(Exp)的值: E = 1 – Bias (instead\space of\space E = 0 – Bias)\\ 尾数(Significand)编码隐含先导数值0: M = 0.xxx…x_2$

特殊值

$000…0\\ 表示无穷(infinity) 、溢出的运算\\ 正无穷:0\space 111111111\space 000…0\\ 负无穷:1\space 111111111\space 000…0\\$

$000…0\\ 表示：不是一个数Not-a-Number (NaN)\\ 表示没有数值结果，例如:sqrt(–1), \infty− \infty, \infty*0$

当输入数据是一个不可表示数时，机器将其转换位最邻近的可表示数。

舍入模式

向偶数舍入（默认的舍入模式）

其他方法都有统计偏差——对正整数集合求和时，和将始终被低估或高估（负偏差、正偏差）

当恰好在两个可能的数值正中间时（中间值时）：舍入后，最低有效位的数码为偶数
其他时候：向最近的数值舍入，比中间值小向下舍入，比中间值大向上舍入

10进制数向最近的百分位舍入为例：
7.8949999 ==> 7.89 (比中间值小：向下舍入)
7.8950001 ==> 7.90 (比中间值大：向上舍入)
7.8950000 ==> 7.90 (中间值—向上舍入)
7.8850000 ==> 7.88 (中间值—向下舍入)

二进制数的舍入

$偶数:最低有效位值为0\\ 中间值:舍入位置右侧的位都是0，即形如: xxx\space 100…_2$

浮点数运算

基本思想

首先，计算精确结果；然后，变换到指定格式
阶码(Exp) 太大可能溢出，小数部分可能需要舍入

浮点乘法

在这里插入图片描述

浮点数加法

在这里插入图片描述

C语言的浮点数

从int转换为float，不会发生溢出，但有可能舍入
从int或float转换为double时，能保留精确值
从double转换为float和int时，可能发生溢出，也有可能舍入
从float或double转换为int时，因为int没有小数部分，所以数据可能会向0方向截断
$int\space x = …;\\ float\space f = …;\\ double\space d = …;\\$

表达式	判断Y/N
x == (int)(float) x	No: 24 位尾数
x == (int)(double) x	Yes: 53位尾数
f == (float)(double) f	Yes: 增加精度
d == (float) d	No: 损失精度
f == -(-f);	Yes: 仅仅改变符号位
2/3 == 2/3.0	No: 2/3 == 0
d < 0.0 => ((d*2) < 0.0)	Yes! 单调
d > f => -f < -d	Yes 对称
d *d >= 0.0	Yes!
(d+f)-d == f	No: 不具备结合性