计算机系统基础第二章知识点梳理

最新推荐文章于 2023-07-22 00:11:24 发布

lemonaaaaa23

最新推荐文章于 2023-07-22 00:11:24 发布

阅读量1.9k

点赞数 1

分类专栏：计算机体系结构文章标签：补码 c++ c语言反汇编操作系统

本文链接：https://blog.csdn.net/qq_16536725/article/details/108029292

版权

计算机体系结构专栏收录该内容

2 篇文章 4 订阅

订阅专栏

第二章数据的机器级表示与处理

数制和编码

十进制、二进制、十六进制、八进制……
定/浮点表示

数制

十进制(Decimal)：结尾加D表示。
二进制(Binary)：结尾加B表示。
八进制(Octal)：结尾加O表示。
十六进制(Hexadecimal)：结尾加H表示或者前缀加0x表示。

进制转换：

整数部分：除基取余，上左下右
小数部分：乘基取整，上左下右

定点数和浮点数

计算机中只能通过约定小数点的位置来表示小数点

小数点位置约定在固定位置的数称为定点数
小数点位置约定为可浮动的数称为浮点数

实数的定义： $X=(-1)^s \times M \times R^E$
其中 $S$ 取值为 $0$ 或者 $1$ ，用来决定数 $X$ 的符号； $M$ 是尾数， $E$ 是阶/指数。 $R$ 是基数。

定点数的编码

原码、补码、移码、反码

原码：最高位的 $0$ / $1$ 表示正负，数值部分不变。但是缺点有： $0$ 的表示不唯一，不利于编程；加减运算方式不统一；对硬件设计的要求较高；特别是当 $a < b$ 时候，实现 $a - b$ 比较困难。
补码（从50年代以来整数采用的编码方式）： $[X]_\text{补}=2^n + X$ 。同时补码实现了加和减的统一。
结论一：一个负数的补码等于模减该负数的绝对值
结论二：对于某一确定的模，某数减去小于模的另一数，总可以用该数加上另一数负数的补码来代替实现了加法和减法的统一。
变形补码：采用双符号位存放可能溢出的中间结果。
负数的补码的简便求法：从右至左遇到的第一个 $1$ 的前面各位取反（不含这个 $1$ ）
移码：将每一个数值加上一个偏置常数bias。
反码：直接将二进制按位取反，一般没什么用。

C语言中的数

整数

2-2-1-1

其中整数类型分为带符号整数和无符号整数。

2-2-1-2

整数表示比较简单，大概熟悉C语言的程序员都掌握的比较好。

浮点数

浮点数的表示就很复杂了，编码上有许多细节。

首先是对科学计数法的概念：

2-2-2-1

浮点数的表示范围：

2-2-2-2

第0位数符S；第1-8位为8位移码表示阶码 $E$ （偏置常数为128）
第9～31位为24位二进制原码小数表示的尾数 $M$ 。规格化尾数的小数点后第一位总是1，故规定第一位默认的“1”不明显表示出来。这样可用23个数位表示24位尾数

最大正数： $\dots 1 \times 2^{11 \dots 11} = (1-2^{-24}) \times 2 ^{127}$
最小正数： $\dots 0 \times 2^{00 \dots 0} = (1/2) \times 2^{-128}$

2-2-2-3

IEEE 754 标准(重点)

2-2-2-4

规格化数

Exponent	Significand
1-254	任意小数点前隐含1
0	0	+/-0
255	0	+/-inf
255	nonzero	NaN

非规格化数

当 $E x p o n e n t = = 0$ 并且 $S i g n i f i c a n d! = 0$ 时，用来表示非规格化数。

2-2-2-5

非数值表示

西文字符

ASCII控制字符

二进制	十进制	十六进制	缩写	可以显示的表示法	名称/意义
0000 0000	0	00	NUL	␀	空字符（Null）
0000 0001	1	01	SOH	␁	标题开始
0000 0010	2	02	STX	␂	本文开始
0000 0011	3	03	ETX	␃	本文结束
0000 0100	4	04	EOT	␄	传输结束
0000 0101	5	05	ENQ	␅	请求
0000 0110	6	06	ACK	␆	确认回应
0000 0111	7	07	BEL	␇	响铃
0000 1000	8	08	BS	␈	退格
0000 1001	9	09	HT	␉	水平定位符号
0000 1010	10	0A	LF	␊	换行键
0000 1011	11	0B	VT	␋	垂直定位符号
0000 1100	12	0C	FF	␌	换页键
0000 1101	13	0D	CR	␍	归位键
0000 1110	14	0E	SO	␎	取消变换（Shift out）
0000 1111	15	0F	SI	␏	启用变换（Shift in）
0001 0000	16	10	DLE	␐	跳出数据通讯
0001 0001	17	11	DC1	␑	设备控制一（XON 启用软件速度控制）
0001 0010	18	12	DC2	␒	设备控制二
0001 0011	19	13	DC3	␓	设备控制三（XOFF 停用软件速度控制）
0001 0100	20	14	DC4	␔	设备控制四
0001 0101	21	15	NAK	␕	确认失败回应
0001 0110	22	16	SYN	␖	同步用暂停
0001 0111	23	17	ETB	␗	区块传输结束
0001 1000	24	18	CAN	␘	取消
0001 1001	25	19	EM	␙	连接介质中断
0001 1010	26	1A	SUB	␚	替换
0001 1011	27	1B	ESC	␛	跳出
0001 1100	28	1C	FS	␜	文件分割符
0001 1101	29	1D	GS	␝	组群分隔符
0001 1110	30	1E	RS	␞	记录分隔符
0001 1111	31	1F	US	␟	单元分隔符
0111 1111	127	7F	DEL	␡	删除

ASCII可显示字符

二进制	十进制	十六进制	图形
0010 0000	32	20	（空格）(␠)
0010 0001	33	21	!
0010 0010	34	22	"
0010 0011	35	23	#
0010 0100	36	24	$
0010 0101	37	25	%
0010 0110	38	26	&
0010 0111	39	27	'
0010 1000	40	28	(
0010 1001	41	29	)
0010 1010	42	2A	*
0010 1011	43	2B	+
0010 1100	44	2C	,
0010 1101	45	2D	-
0010 1110	46	2E	.
0010 1111	47	2F	/
0011 0000	48	30	0
0011 0001	49	31	1
0011 0010	50	32	2
0011 0011	51	33	3
0011 0100	52	34	4
0011 0101	53	35	5
0011 0110	54	36	6
0011 0111	55	37	7
0011 1000	56	38	8
0011 1001	57	39	9
0011 1010	58	3A	:
0011 1011	59	3B	;
0011 1100	60	3C	<
0011 1101	61	3D	=
0011 1110	62	3E	>
0011 1111	63	3F	?

二进制	十进制	十六进制	图形
0100 0000	64	40	@
0100 0001	65	41	A
0100 0010	66	42	B
0100 0011	67	43	C
0100 0100	68	44	D
0100 0101	69	45	E
0100 0110	70	46	F
0100 0111	71	47	G
0100 1000	72	48	H
0100 1001	73	49	I
0100 1010	74	4A	J
0100 1011	75	4B	K
0100 1100	76	4C	L
0100 1101	77	4D	M
0100 1110	78	4E	N
0100 1111	79	4F	O
0101 0000	80	50	P
0101 0001	81	51	Q
0101 0010	82	52	R
0101 0011	83	53	S
0101 0100	84	54	T
0101 0101	85	55	U
0101 0110	86	56	V
0101 0111	87	57	W
0101 1000	88	58	X
0101 1001	89	59	Y
0101 1010	90	5A	Z
0101 1011	91	5B	[
0101 1100	92	5C	\
0101 1101	93	5D	]
0101 1110	94	5E	^
0101 1111	95	5F	_

二进制	十进制	十六进制	图形
0110 0000	96	60	`
0110 0001	97	61	a
0110 0010	98	62	b
0110 0011	99	63	c
0110 0100	100	64	d
0110 0101	101	65	e
0110 0110	102	66	f
0110 0111	103	67	g
0110 1000	104	68	h
0110 1001	105	69	i
0110 1010	106	6A	j
0110 1011	107	6B	k
0110 1100	108	6C	l
0110 1101	109	6D	m
0110 1110	110	6E	n
0110 1111	111	6F	o
0111 0000	112	70	p
0111 0001	113	71	q
0111 0010	114	72	r
0111 0011	115	73	s
0111 0100	116	74	t
0111 0101	117	75	u
0111 0110	118	76	v
0111 0111	119	77	w
0111 1000	120	78	x
0111 1001	121	79	y
0111 1010	122	7A	z
0111 1011	123	7B	{
0111 1100	124	7C	\|
0111 1101	125	7D	}
0111 1110	126	7E	~

汉字

汉字的区位码：由94行、94列组成，行号为区号，列号为位号。
汉字的国标码：将区号和位号各自加上32(20H)。国标码中区号和位号各占7位。在计算机内部，为方便处理与存储，前面添一个0，构成一个字节。
至少需要2个字节才能表示一个汉字内码（因为汉字总数超过6万个）

数据宽度和储存容量

容量单位

中文	表示	转化
千字节	KB	$2^{10} \text{字节} = 1024 B$
兆字节	MB	$2^{20} \text{字节} = 1024 KB$
千兆字节	GB	$2^{30} \text{字节} = 1024 MB$
兆兆字节	TB	$2^{40} \text{字节} =1024 GB$

通信中的带宽单位

中文	表示	转化
千比特/秒	kb/s	$1kbps = 10^{3} b/s = 1000 bps$
兆比特/秒	Mb/s	$1Mb/s = 10^{6} b/s = 1000 kbps$
千兆比特/秒	Gb/s	$1Gb/s = 10^{9} b/s = 1000 Mbps$
兆兆比特/秒	Tb/s	$1Tb/s = 10^{12} b/s =1000 Gbps$

注意：容量单位和带宽单位里面明显大小写有一些不一样，因为表示的含义不同，一个是1000，一个1024.

C语言中数据类型的宽度

C声明	典型32位机器(单位：字节)	典型64位机器(单位：字节)
char	1	1
short int	2	2
int	4	4
long int	4	8
char*	4	8
float	4	4
double	8	8

long double 的确切精度没有规定，所以对于不同平台来说，有的是8字节，有的是10字节，有的是12字节或者16字节。

数据的存储和排列顺序

80年代开始，几乎所有通用计算机都采用字节编址。在高级语言中声明的基本数据类型有char、short、int、long、long long、float、double、long double等各种不同长度数据，一个基本数据可能会占用多个存储单元。所以有一些问题我们还需要考虑，比如说：变量的地址是其最大地址还是最小地址？多个字节在存储单元中存放的顺序如何？

大/小端方式

2-5-1-1

测试代码：

#include &lt; cstdio &gt;
#include &lt; cstring &gt;
#include &lt; algorithm &gt;
using namespace std;
const int maxn=200005;

int main()
{
	union NUM
	{
		int a;
		char b;
	} num;
	num.a=0x12345678;
	if(num.b==0x12) printf("Big Endian\n");
	else printf("Little Endian\n");
	printf("num.b=0x%X\n",num.b);
	return 0;
}

在我的机器上运行的结果：

2-5-1-2

大小端非常重要，因为在看指令的时候，大小端不同，表示的值就不同。
注意：IA-32采用的是小端方式。

数字逻辑电路

布尔代数

$A$	$B$	$\cdot B$	$A + B$	$\bar{A}$	$\oplus B$
0	0	0	0	1	0
0	1	0	1	1	1
1	0	0	1	0	1
1	1	1	1	0	0

全加器(一位加法器)

两个加数为 $A$ 和 $B$ ，低位进位为Cin，和为 $F$ ，向高位的进位为Cout。
化简之后，逻辑表达式如下：
$\oplus B \oplus Cin$
$\cdot B + A \cdot Cin + B \cdot Cin$

2-6-2

n位加法器

n位加法器可用n个全加器实现

无符号整数加

2-6-3-1-1

2-6-3-1-2

带符号整数加

溢出标志OF： $OF=C_n \oplus C_{n-1}$
符号标志SF： $SF=F_{n-1}$
零标志ZF： $Z F = 1$ 当且仅当 $F = 0$
进位/借位标志CF： $\oplus Cin$

2-6-3-2-1

2-6-3-2-2

n位整数加/减运算器

$[A+B]_{\text{补}} = [A]_{\text{补}} + [B]_{\text{补}} (mod\;\;2^n)$
$[A-B]_{\text{补}} = [A]_{\text{补}} + [-B]_{\text{补}} (mod\;\;2^n)$

2-6-4-1

当 $S u b$ 为 $1$ 时，做减法。
当 $S u b$ 为 $0$ 时，做加法。

算术逻辑部件ALU：

2-6-4-2

数据的运算

高级语言程序中涉及的运算（以C语言为例）

整数算术运算、浮点数算术运算
按位、逻辑、移位、位扩展和位截断等运算

指令集中涉及到的运算：

涉及到的定点数运算：

算术运算：

带符号整数：取负/ 符号扩展/ 加/ 减/ 乘/ 除 / 算术移位
无符号整数：0扩展/ 加/ 减/ 乘/ 除/ 逻辑左移/ 逻辑右移

逻辑运算：

逻辑操作：与/ 或/ 非/ …

涉及到的浮点数运算：加、减、乘、除

指令中的运算操作在运算电路中进行

基本运算部件ALU、通用寄存器组，以及其他部件

整数的加减运算

计算机中所有运算都基于加法器实现。
加法器不知道所运算的是带符号数还是无符号数。
加法器不判定对错，总是取低n位作为结果，并生成标志信息。

无符号数

加法：

当 $x+y < 2^n, result=x+y$
当 $2^n \leq x+y < 2^{n+1}, result=x+y-2^n$

减法：

当 $x-y<0, result=x-y+2^n$
当 $\geq 0, result=x-y$

带符号数

加法：

当 $x+y<-2^{n-1}, result=x+y+2^n$ ，负溢出
当 $-2^{n-1} \leq x+y < 2^{n-1}, result=x+y$ ，正常
当 $\geq 2^{n-1}, result=x+y-2^n$ ，正溢出

减法：

当 $x-y<-2^{n-1}, result=x-y+2^n$ ，负溢出
当 $-2^{n-1} \leq x-y <2^{n-1}, result=x-y$ ，正常
当 $\geq 2^{n-1}, result=x-y-2^n$ ，正溢出

lemonaaaaa23

关注

1
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
计算机系统基础第二章知识点梳理

第二章数据的机器级表示与处理数制和编码十进制、二进制、十六进制、八进制……定/浮点表示数制十进制(Decimal)：结尾加D表示。二进制(Binary)：结尾加B表示。八进制(Octal)：结尾加O表示。十六进制(Hexadecimal)：结尾加H表示或者前缀加0x表示。进制转换：整数部分：除基取余，上左下右小数部分：乘基取整，上左下右定点数和浮点数计算机中只能通过约定小数点的位置来表示小数点小数点位置约定在固定位置的数称为定点数小数点位置约定为可浮动的数称为浮点数
复制链接

扫一扫