三、计算机中信息的表示
(一)数制及其转换 ★★★
进位计数制:用进位的原则进行计数称为进位计数制,简称数制。
数码:一组用来表示某种数制的符号。如:1、2、3、4、A、B、C、Ⅰ、Ⅱ、Ⅲ、Ⅳ等。
基数:数制所使用的数码个数称为“基数”或“基”,常用“R”表示,称为R进制。如二进制的数码是0、1,基为2。
位权:指数码在不同位置上的权值。在进位计数制中,处于不同数位的数码代表的数值不同。如十进制数111,个位数上的1 的权值为100,十位数上的1 的权值为101,百位数上的1 的权值为102。
1. 常见的几种进位计数制
2. 数制的转换
(1) 二进制、八进制、十六进制数转化为十进制数
方法:按权展开,依次相加。
例如:
注意:在不至于产生歧义时,可以不注明十进制数的进制,如上例。
(2)十进制数转化为二进制数
方法:整数部分:短除法,除以2,逆序取余,除到0 为止。
小数部分:乘以2,顺序取整。(参见下例)
例:将十进制数100.125转化为二进制数
步骤一:先对整数100进行转换:
由上得出,100D=1100100B。
步骤二:对于小数部分0.125的转换
由上得出,0.125D=0.001B。
将整数和小数部分组合,得出:100.125D = 1100100.001B。
(3)二进制数与八进制数的相互转换
方法:二进制转换为八进制,以小数点为左右起点,三位为一组,缺位补0,每一组二进制数对应八进制数码中的一个数字,然后全部连接起来。
例:把二进制数11111101.101转化为八进制数。
所以,11111101.101B = 375.5O。
方法:八进制数转换成二进制数,只要将每一位八进制数转换成相应的3位二进制数,依次连接起来即可。
(4)二进制数与十六进制数的相互转换
方法:二进制转换为十六进制,以小数点为左右起点,四位为一组,缺位补0,每一组二进制数对应十六进制数码中的一个数字,然后全部连接起来。
十六进制数转换成二进制数,只要将每一位十六进制数转换成4位二进制数,然后依次连接起来即可。
例:将10110001.101B转换为十六进制数。
3. 二进制的运算规则
(1)算术运算规则
加法规则:0 + 0 = 0; 0 + 1 = 1;
1 + 0 = 1;1 + 1 = 10(向高位有进位);
减法规则:0 - 0 = 0;10 - 1 = 1(向高位借位);
1 - 0 = 1; 1 - 1 = 0;
乘法规则:0×0 = 0; 0×1 = 0;
1×0 = 0;1×1 = 1;
除法规则:0/1 = 0;1/1 = 1;
(2)逻辑运算规则
与运算(AND):0∧0 = 0;0∧1 = 0;1∧0 = 0;1∧1 = 1;(同逻辑乘)
或运算(OR): 0∨0 = 0; 0∨1 = 1;1∨0 = 1; 1∨1 = 1;
异或运算(XOR):0⊕0=0;0⊕1=1;1⊕0=1;1⊕1=0;(相同为0,不同为1)
逻辑异或运算即实现按位加的功能,只有当两个逻辑值不相同时,结果才为1。
(二)信息的编码 ★★
1. 计算机中数据的单位
(1)位(bit)
位,也称为比特,简记为b,也称为比特,是计算机存储数据的最小单位。一个二进制位只能表示0或1。
(2)字节(Byte)
字节来自英文Byte,简记为B。字节是存储信息的基本单位。规定1B=8bit。字节是存储信息的基本单位。我们还经常
(3)字(Word)
计算机处理数据时,CPU通过数据总线一次存取、加工和传送的数据称为字,计算机的运算部件能同时处理的二进制数据的位数称为字长。一个字通常由一个字节或若干个字节组成。字长是计算机一次所能处理的实际位数长度,字长是衡量计算性能的一个重要指标。
2. 数值的表示
在计算机中,所有数据都以二进制的形式表示。
通常规定一个数的最高位作为符号位,“0”表示正,“1”表示负。
采用二进制表示形式的连同数符一起代码化了的数据称为机器数;而与机器数对应的用正、负符号加绝对值来表示的实际数值称为真值。
(1)原码、反码、补码
例如:-43
(2)BCD码
BCD码:把十进制数和二进制数相互转换的一种编码。
3. 文字信息的表示
(1)字符编码:
目前采用的字符编码主要是ASCII码。ASCII码是一种西文机内码,有7位ASCII码和8位ASCII码两种,7位ASCII码称为标准ASCII码,8位ASCII码称为扩展ASCII码。7位标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位,因此可表示128个不同字符。对于同一个字母的ASCII码值小写字母比大写字母大32。
(2)汉字编码
a.汉字交换码:
一般用连续的两个字节(16个二进制位)来表示一个汉字。1980年,我国颁布了第一个汉字编码字符集标准,即GB2312-80《信息交换用汉字编码字符集基本集》,该标准编码简称国标码,是我国大陆地区及新加坡等海外华语区通用的汉字交换码。GB2312-80收录了6763个汉字,以及682符号,共7445个字符,奠定了中文信息处理的基础。
b. 汉字机内码:
国标码GB2312不能直接在计算机中使用,以为它没有考虑与基本的信息交换代码ASCII码的冲突。为了能区分汉字与ASCII码,在计算机内部表示汉字时把交换码(国标码)两个字节最高位改为1,称为机内码。
机内码是真正的计算机内部用来存储和处理汉字信息的代码。
c. 汉字字形码:
汉字字形码是用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。
汉字字形码记录汉字的外形,是汉字的输出形式。记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。
点阵码是一种用点阵表示汉字字形的编码,它把汉字按字形排列成点阵,常言道点阵有16×16、24×24、32×32或更高。一个16×16点阵的汉字要占用32个字节,一个32×32点阵的汉字则要占用128字节,而且点阵码缩放困难且容易失真。
矢量码:使用一组数学矢量来记录汉字的外形轮廓。可任意缩放,节省存储空间。
d. 汉字输入码:
将汉字通过键盘输入到计算机采用的代码称为汉字输入码,也称为汉字外部码(外码)。
汉字输入码可分为流水码、音码、形码和音形结合码四种。