今天在写 "quoted-printable" 编码的时候突然想起对于刚进入工作岗位的程序员来说,是很不喜欢移位操作的。我刚入行的时候也是如此,一来是移位的运算结果需要转换成二进制后再能校验运算结果是否正确,二是不同的数据类型移位的操作结果并不是唯一的。不过我们这次要说的移位操作比较简单,也比较重要。这种算法在编码/解码过程中是经常会碰到的,那就是8位单字节数据的移位结果。它的实际用途可以用常见的字节内容显示为16进制字符串的算法来做个示例。
在学校时,我们就学过可以用 printf 来输出一个数据的 16 进制内容,例如:
/*按16进制输出,默认右对齐*/printf("%x\n",PrintVal);
在 delphi 等于开发语言中也有类似的函数,但象"quoted-printable" 编码这样的实现在 C 语言中通常不可能用这样的函数去转换 16 进制的,原因只有一个:性能问题。因为一般用 C 语言实现都是冲着高性能去的,等等,就算是 java 语言,早年我看到的 "base64" 相关编解码函数也是自己实现的16进制转换。
而 16 进制的转换用移位操作可以有一个非常高效而巧妙的算法:一个字节是 8 位,能表示 256 个数据,转换成16进制就要用两个可见字符来表示,那么实际上就是每个可见字符表示 256 个数据中的一半,也就是 8 位数据中的一半 -- 即 4 位数据。而4位二进制最多能表示 16 个数据(两个16种可能性组合在一起就是 256 种,即 16x16=256)。所以用16进制就刚好可以用两个字节的可见字符来表示任意一种8位字节的二进制数据,这也是为什么在计算机代码中要表示非可见内容时一般都是用 16 进制。