近日沉迷ACM不能自拔,恰巧碰到一个位运算的题目卡在了原理上,主要涉及了补码的问题。查了不少资料,看到了一些讲的很好的文章,但细读下来也存在一些问题。
回头翻看教科书,发现多数教科书也并未给出很好的解释。
这一部分内容在高校大一时的大学计算机基础有教授,但限于当时对进位制掌握不完全,编码也没有初步理解,因此多数人还是“满秩茫然”的状态。
这篇文是按照我的思路整理必要的概念和原理,希望对希望“刨根问底”、究其根源的同学有一些帮助。
本文分为两部分:先阐述概念和结论,再探究概念的合理性及结论的正确性。
这篇文章的目的是希望读者在仅掌握进位制知识(具体来说是二进制)的前提下能理解原码、反码、补码的概念和由来。
为了讨论问题方便,通篇均假设:一个十进制数由4位二进制数表示。暂且忽略int类型的值占用4字节的问题。位数问题仅涉及取值范围,不影响讨论的一般性。
还要说一个“人尽皆知”的事实:数据在计算机内存中是以补码的形式存储的。
一. 原码、反码、补码的概念:
原码:数字本身的二进制表示+符号位,其中符号位占用数字本身二进制的最高位。原码的具体位数(bits)由操作系统、数据类型、编译器联合决定。
举个例子:十进制的1即为0001,其中最高位0为符号位,表示正数。如果最高位为1则表示负数。
反码:除去符号位,原码的其他位按位取反。
补码:正数的补码就是原码,而负数的补码为其反码+1。于是我们结合反码的定义,就得到与教科书上一致的结论:负数的补码=(除符号位)原码按位取反再+1。