信息的表示和处理

最新推荐文章于 2024-01-12 20:48:47 发布

从零开始学习的ZHL

最新推荐文章于 2024-01-12 20:48:47 发布

阅读量264

点赞数

分类专栏：深入理解计算机系统学习笔记

本文链接：https://blog.csdn.net/qq_22080999/article/details/95034503

版权

深入理解计算机系统学习笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

int32_t 和 int64_t 分别为4个字节和8个字节，数据大小固定，不随编译器和机器设置而变化。

在内存中按照从最低有效字节到最高有效字节的顺序存储对象，小端法。

按照从最高有效字节到最低有效字节的顺序存储对象，大端法。

文本数据比二进制数据具有更强的平台独立性。二进制代码是不兼容的，很少能在不同机器和操作系统组合之间移植。

在整数运算中，每个值x有一个加法逆元-x，使得x+(-x)=0。布尔环，加法逆元是它自身，“+”号是^异或。a^a=0,(a^b)^a=b.

位向量的一个很有用的应用是表示有限集合。可以用位向量 $[a_{w-1},...,a_{1},a_{0}]$ 编码任何子集 $A\subseteq \left \{ 0,1,...,w-1 \right \}$ ,其中 $a_{i}=1$ 当且仅当 $i\in A$ 。布尔运算的|和&对应集合的并和交，~对应集合的补。

位级运算的一个常见用法是实现掩码运算，这里掩码是一个位模式，表示从一个字中选出的位的集合。

移位运算。左移，丢弃最高k位，右端补k个0.

右移，分为逻辑右移和算术右移。逻辑右移在左端补k个0,算术右移补k个最高有效位的值。

C语言标准没有明确定义有符号数应该使用哪种右移。几乎所有编译器是算术右移。对无符号数，右移必须是逻辑的。

当移位量k大于等于位数w时，

int lval = 0xFEDCBA98 <<32;
int aval = 0xFEDCBA98 >>36;
unsigned uval = 0xFEDCBA98u >>40;

因为实际位移量是通过 k mod w得到的，所以上面三个的移位0,4,8位。

对C程序应该保持移位量小于位数。

无符号数的编码：

原理：无符号数编码的定义，对向量 $\vec{x}=[x_{w-1},x_{w-2},...,x_{0}]$ , $B2U_{w}(\vec{x})\doteq \sum_{i=0}^{w-1}x_{i}2^{i}$

原理：无符号数编码的唯一性，函数 $B2U_{w}$ 是一个双射。

最大值 $UMax_{w}\doteq \sum_{i=0}^{w-1}2^{i} = 2^{w}-1$ ,最小值0

补码编码：

补码编码的定义，对向量 $\vec{x}=[x_{w-1},x_{w-2},...,x_{0}]$ ： $B2T_{w}(\vec{x})\doteq - x_{w-1}2^{w-1}+\sum_{i=0}^{w-2}x_{i}2^{i}$

w位补码所能表示的值的范围，能表示的最小值是位向量[10...0]，整数值为 $TMin_{w}\doteq -2^{w-1}$ 。最大值是[01...1],整数值是 $TMax_{w}\doteq \sum_{i=0}^{w-2}2^{i}=2^{w-1}-1$ 。

原理：补码编码的唯一性。

使用宏能保证：不论代码是如何被编译的，都能生成正确的格式字符串。

有符号数还有两种标准的表示方法：

反码：除了最高有效位的权是 $-(2^{w-1}-1)$ ,而不是 $-2^{w-1}$ ,它和补码是一样的： $B2O_{w}(\vec{x})\doteq -x_{w-1}(2^{w-1}-1)+\sum_{i=0}^{w-2}x_{i}2^{i}$ .

原码：最高有效位是符号位，用来确定剩下的位应该取负权还是正权： $B2S_{w}(\vec{x})\doteq (-1)^{x_{w-1}}\sum_{i=0}^{w-2}x_{i}2^{i}$

有符号数和无符号数之间的转换：

对于大多数C语言的实现，处理同样字长的有符号数和无符号数之间相互转换的一般规则是：数值可能会改变，但是位模式不变。强制类型转换的结果保持位值不变，只是改变了解释这些位的方式。

给定位模式的补码和无符号数之间的关系可以表示成T2U函数的一个属性：

原理：补码转换为无符号数，对满足 $TMin_{w}\leq x\leq TMax_{w}$ 的x有： $T2U_{w}(x)=\left\{\begin{matrix} x+2^{w},x<0\\ x,x\geq 0 \end{matrix}\right.$

无符号数u和有符号数关系， $U2T_{w}(u)$ :

原理：无符号数转换为补码，对满足 $0\leq u\leq UMax_{w}$ 的u有： $U2T_{w}(u)=\left\{\begin{matrix} u,u\leq TMax_{w}\\ u-2^{w},u> TMax_{w} \end{matrix}\right.$

无符号数和有符号数的转换，如果在某范围内，数值不变的，或者就是加减了个 $2^{w}$ .

C语言对同时包含有符号和无符号数表达式的处理，会隐式地将有符号参数强制转换为无符号数，并假设这两个数都是非负的。

扩展一个数字的位表示：

要将一个无符号数转换为一个更大的数据类型，只要简单的在表示的开头添加0,这种运算称为零扩展。

要将一个补码数字转换为一个更大的数据类型，可以执行符号扩展，在表示中添加最高有效位的值。(推导就没看了）

截断数字：

截断无符号数：令 $\vec{x}=[x_{w-1},x_{w-2},...,x_{0}]$ ，而 ${\vec{x}}'$ 是将其截断为k位的结果，等于 $[x_{k-1},x_{k-2},...,x_{0}]$ ，令 $x=B2U_{w}(\vec{x}),x{}'=B2U_{k}(\vec{{x}'})$ ,则 $x{}'=x mod 2^{k}$ .

整数运算：

为参数x,y定义一个运算： $+_{w}^{u}$ ,其中 $0\leq x,y< 2^{w}$ .该操作是，把整数和x+y截断为w位得到的结果，再把这个结果看作是一个无符号数。

原理：无符号数加法

对满足 $0\leq x,y< 2^{w}$ 的x和y有： $x+_{u}^{w}y=\left\{\begin{matrix} x+y, x+y<2^{w}\\ x+y-2^{w},2^{w}\leq x+y< 2^{w+1} \end{matrix}\right.$

原理：检测无符号数加法中的溢出。对在范围 $0\leq x,y\leq UMax_{w}$ 中的x和y,令 $s\doteq x+_{u}^{w}y$ ,则当且仅当s<x（或者s<y）时，发生了溢出。

原理：无符号数求反。对满足 $0\leq x< 2^{w}$ 的任意x，其w位的无符号逆元 $-_{w}^{u}x$ 由下式给出： $-_{w}^{u}x=\left\{\begin{matrix} x,x=0\\ 2^{w}-x,x> 0 \end{matrix}\right.$ .

补码加法：

定义 $x+_{w}^{t}y$ 为整数和x+y被截断为w位的结果，并将这个结果看作是补码数。

原理：补码加法。对满足 $-2^{w-1}\leq x,y\leq 2^{w-1}-1$ 的整数x和y，有： $x+_{w}^{t}y=\left\{\begin{matrix} x+y-2^{w} ,& 2^{w-1}\leq x+y& +overflow\\ x+y,& -2^{w-1}\leq x+y< 2^{w-1}&zhengchang \\ x+y+2^{w},&x+y<-2^{w-1} & -overflow \end{matrix}\right.$

原理：检测补码加法中的溢出。对满足 $TMin_{w}\leq x,y\leqslant TMax_{w}$ 的x和y，令 $s\doteq x+_{w}^{t}y$ 。当且仅当x>0,y>0，但 $s\leq 0$ 时，计算s发生了正溢出。当且仅当x<0,y<0,但 $s\geq 0$ 时，计算s发生了负溢出。

补码的非：

对满足 $TMin_{w}\leq x\leq TMax_{w}$ 的x，其补码的非 $-_{w}^{t}x$ 由下式给出， $-_{w}^{t}x=\left\{\begin{matrix} TMin_{w} ,&x=TMin_{w} \\ -x,& x>TMin_{w} \end{matrix}\right.$