反码，补码，符号

最新推荐文章于 2023-03-08 00:07:50 发布

one_u_h

最新推荐文章于 2023-03-08 00:07:50 发布

阅读量570

点赞数

分类专栏： FPGA基础

本文链接：https://blog.csdn.net/qq_37363005/article/details/98177596

版权

FPGA基础专栏收录该内容

13 篇文章 2 订阅

订阅专栏

一. 机器数和真值
在学习原码, 反码和补码之前, 需要先了解机器数和真值的概念.

1、机器数
一个数在计算机中的二进制表示形式, 叫做这个数的机器数***。机器数是带符号的，在计算机用一个数的最高位存放符号, 正数为0, 负数为1.*
比如，十进制中的数 +3 ，计算机字长为8位，转换成二进制就是00000011。如果是 -3 ，就是 10000011 。
那么，这里的 00000011 和 10000011 就是机器数。

2、真值
因为第一位是符号位，所以机器数的形式值就不等于真正的数值。例如上面的有符号数 10000011，其最高位1代表负，其真正数值是 -3 而不是形式值131（10000011转换成十进制等于131）。所以，为区别起见，将带符号位的机器数对应的真正数值称为机器数的真值。

例：0000 0001的真值 = +000 0001 = +1，1000 0001的真值 = –000 0001 = –1

二. 原码, 反码, 补码的基础概念和计算方法.
在探求为何机器要使用补码之前, 让我们先了解原码, 反码和补码的概念.对于一个数, 计算机要使用一定的编码方式进行存储. 原码, 反码, 补码是机器存储一个具体数字的编码方式.

原码
原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其余位表示值. 比如如果是8位二进制:

[+1]原 = 0000 0001

[-1]原 = 1000 0001

第一位是符号位. 因为第一位是符号位, 所以8位二进制数的取值范围就是:

[1111 1111 , 0111 1111]
即
[-127 , 127]

原码是人脑最容易理解和计算的表示方式.

反码
反码的表示方法是:
正数的反码是其本身
负数的反码是在其原码的基础上, 符号位不变，其余各个位取反。

[+1] = [00000001]原 = [00000001]反
[-1] = [10000001]原 = [11111110]反

可见如果一个反码表示的是负数, 人脑无法直观的看出来它的数值. 通常要将其转换成原码再计算.

补码
补码的表示方法是:
正数的补码就是其本身
负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)

[+1] = [00000001]原 = [00000001]反 = [00000001]补

[-1] = [10000001]原 = [11111110]反 = [11111111]补

对于负数, 补码表示方式也是人脑无法直观看出其数值的. 通常也需要转换成原码在计算其数值.

三. 为何要使用原码, 反码和补码
在开始深入学习前, 我的学习建议是先"死记硬背"上面的原码, 反码和补码的表示方式以及计算方法.

现在我们知道了计算机可以有三种编码方式表示一个数. 对于正数因为三种编码方式的结果都相同:
[+1] = [00000001]原 = [00000001]反 = [00000001]补
所以不需要过多解释. 但是对于负数:
[-1] = [10000001]原 = [11111110]反 = [11111111]补
可见原码, 反码和补码是完全不同的. 既然原码才是被人脑直接识别并用于计算表示方式, 为何还会有反码和补码呢?
首先, 因为人脑可以知道第一位是符号位, 在计算的时候我们会根据符号位, 选择对真值区域的加减. (真值的概念在本文最开头). 但是对于计算机, 加减乘数已经是最基础的运算, 要设计的尽量简单. 计算机辨别"符号位"显然会让计算机的基础电路设计变得十分复杂! 于是人们想出了将符号位也参与运算的方法. 我们知道, 根据运算法则减去一个正数等于加上一个负数, 即: 1-1 = 1 + (-1) = 0 , 所以机器可以只有加法而没有减法, 这样计算机运算的设计就更简单了.

于是人们开始探索将符号位参与运算, 并且只保留加法的方法. 首先来看原码:

计算十进制的表达式: 1-1=0

1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2

如果用原码表示, 让符号位也参与计算, 显然对于减法来说, 结果是不正确的.这也就是为何计算机内部不使用原码表示一个数.

为了解决原码做减法的问题, 出现了反码:

计算十进制的表达式: 1-1=0

1 - 1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原= [0000 0001]反 + [1111 1110]反 = [1111 1111]反 = [1000 0000]原 = -0

发现用反码计算减法, 结果的真值部分是正确的. 而唯一的问题其实就出现在"0"这个特殊的数值上. 虽然人们理解上+0和-0是一样的, 但是0带符号是没有任何意义的. 而且会有[0000 0000]原和[1000 0000]原两个编码表示0.

于是补码的出现, 解决了0的符号以及两个编码的问题:

1-1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原 = [0000 0001]补 + [1111 1111]补 = [0000 0000]补=[0000 0000]原

这样0用[0000 0000]表示, 而以前出现问题的-0则不存在了.而且可以用[1000 0000]表示-128:

(-1) + (-127) = [1000 0001]原 + [1111 1111]原 = [1111 1111]补 + [1000 0001]补 = [1000 0000]补

-1-127的结果应该是-128, 在用补码运算的结果中, [1000 0000]补就是-128. 但是注意因为实际上是使用以前的-0的补码来表示-128, 所以-128并没有原码和反码表示.(对-128的补码表示[1000 0000]补算出来的原码是[0000 0000]原, 这是不正确的)

使用补码, 不仅仅修复了0的符号以及存在两个编码的问题, 而且还能够多表示一个最低数. 这就是为什么8位二进制, 使用原码或反码表示的范围为[-127, +127], 而使用补码表示的范围为[-128, 127].

因为机器使用补码, 所以对于编程中常用到的32位int类型, 可以表示范围是: [-2^31，231-1] 因为第一位表示的是符号位.而使用补码表示时又可以多保存一个最小值。

在这里插入图片描述
整型数据在内存中的存放形式

数据在内存中是以二进制形式存放的

而signed int 表示有符号基本整型

unsigned int 表示无符号基本整型

数值都是以补码形式表示的，一个正数的补码就是其本身，一个负数的补码就是对这个数按位取反然后加1

unsigned int 类型整数其值表示法
范围为：：0～ 2^32 -1

unsigned char类型整数其值表示法
范围为：：0～ 2^8-1

这两个好理解 int型的是32位从0开始所以是0～ 2^32 -1 char型的是8为即是0~255

而

signed int 类型整数其值表示法
范围为：：-2^31 ～ 2^31 -1

signed char类型整数其值表示法
范围为：：-2^7～ 2^7-1

这是一种补码规则

就char型的来说

正数部分数值在内存中的表现形式

               0         00000000
               1         00000001
               2         00000010
              ...
              127     011111111

再加个1 就成为了负数的–128
-128 10000000
-127 10000001
-126 10000010
…
-1 11111111

-1~-128 正好128个数 0~127也正好为128个数加起来是256个数

有了补码就可以实现正常的相加减如 1+（-128） = -127 用补码相加 00000001+10000000=10000001 而10000001就是-127 正好符合。

-0和+0的区别

零在计算机里就是0,不存在正负一说。

0和正数的补码都等于原码，也就是平时说的2进制数。

负数的补码是符号位置一的情况下，对原码求反，再加一得到的。

-0 就是对1 0000 0000 取反加1 得到结果还是00000000 即为+0；

举两例子下面是摘抄下来的

int main()
{
     char a[1000];
     int i;
     for(i=0; i<1000; i++)
     {
             a[i] = -1-i;
     }
     printf("%d",strlen(a));
     return 0;
}

打印的结果是255

按照负数补码的规则，可以知道-1 的补码为0xff，-2 的补码为11111110……当i 的值为127
时，a[127]的值为-128，而-128 是char 类型数据能表示的最小的负数。当i 继续增加，a[128]
的值肯定不能是-129(1 0111 1111)。因为这时候发生了溢出，-129(1 0111 1111)需要9 位才能存储下来，而char 类型数据只有8 位，所以最高位被丢弃。剩下的8 位是原来9 位补码的低8 位的值，即0x7f。
当i 继续增加到255 的时候，-256 的补码的低8 位为0。然后当i 增加到256 时，-257 的补
码的低8 位全为1，即低八位的补码为0xff，如此又开始一轮新的循环……
按照上面的分析，a[0]到a[254]里面的值都不为0，而a[255]的值为0。strlen 函数是计
算字符串长度的，并不包含字符串最后的‘\0’。而判断一个字符串是否结束的标志就是看
是否遇到‘\0’。如果遇到‘\0’，则认为本字符串结束。
分析到这里，strlen(a)的值为255 应该完全能理解了。这个问题的关键就是要明白char
类型默认情况下是有符号的，其表示的值的范围为[-128,127]，超出这个范围的值会产生溢
出。另外还要清楚的就是负数的补码怎么表示。弄明白了这两点，这个问题其实就很简单了。

在看一个

#include <stdio.h>
void foo(void)
{
       unsigned int a = 6;
       int b = -20;
       (a+b>6)? puts(">6"):puts("<=6");
}
 int main()
{
       foo();
       return 0;
}

问输出什么？
打印出>6
问题很好解决b=-20 先要求它的的补码然后进行相加

one_u_h

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
反码，补码，符号

一. 机器数和真值在学习原码, 反码和补码之前, 需要先了解机器数和真值的概念.1、机器数一个数在计算机中的二进制表示形式, 叫做这个数的机器数。机器数是带符号的，在计算机用一个数的最高位存放符号, 正数为0, 负数为1.比如，十进制中的数 +3 ，计算机字长为8位，转换成二进制就是00000011。如果是 -3 ，就是 10000011 。那么，这里的 00000011 和 1000...
复制链接

扫一扫