Base64编码的来龙去脉

Base64编码与Big5编码我一直经常搞混,其实这两者根本是不相关的两码事儿。 Big5编码一般与GBK编码一起提,它是台湾地区主要使用的繁体字编码。 而Base64编码则完全不同,Base64编码的出现是为了在Internet上传递信息而产生的。 在网上传递信息, 处于安全性的考虑,一般要加密传输,但是,加密算法如果太复杂的话,往往会导致效率低下,Base64编码兼顾安全与效率,采用了很简单的加密算法,具体的是:

     Base64是网络上最常见的用于加密传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。 Base64要求把每三个8Bit的字节转换为四个6Bit的字节(3*8 = 4*6 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。 这样说会不会太抽象了?不怕,我们来看一个例子: 转换前 aaaaaabb ccccdddd eeffffff 转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff 应该很清楚了吧?上面的三个字节是原文,下面的四个字节是转换后的Base64编码,其前两位均为0。 转换后,我们用一个码表来得到我们想要的字符串(也就是最终的Base64编码),这个表是这样的:(摘自RFC2045)

 Table 1: The Base64 Alphabet

      Value Encoding  Value Encoding  Value Encoding  Value Encoding
           0 A                  17 R                 34 i                  51 z
           1 B                  18 S                 35 j                  52 0
           2 C                  19 T                 36 k                 53 1
           3 D                  20 U                 37 l                  54 2
           4 E                  21 V                 38 m                55 3
           5 F                  22 W                 39 n                56 4
           6 G                  23 X                  40 o                57 5
           7 H                  24 Y                 41 p                 58 6
           8 I                   25 Z                 42 q                 59 7
           9 J                   26 a                 43 r                  60 8
          10 K                 27 b                 44 s                  61 9
          11 L                 28 c                  45 t                  62 +
          12 M                29 d                  46 u                  63 /
          13 N                30 e                  47 v
          14 O                31 f                  48 w                (pad) =
          15 P                32 g                  49 x
          16 Q                33 h                  50 y


让我们再来看一个实际的例子,加深印象!

转换前101011011011101001110110 
转换后00101011000110110010100100110110
十进制43274154
对应码表中的值rbp2

所以上面的24位编码,编码后的Base64值为 rbp2
解码同理,把 rbq2 的二进制位连接上再重组得到三个8位值,得出原码。

 

例如字符串“张3” :
11010101 11000101 00110011
转换后:
00110101 00011100 00010100 00110011
用十进制表示即为:53 34 20 51
这个并不是最终的结果,还需要根据Base64的编码表查询出转换后的值。下面就是BASE64编码表:
Table 1: The Base64 Alphabet
Value Encoding Value Encoding Value Encoding Value Encoding
0 A 17 R 34 i 51 z
1 B 18 S 35 j 52 0
2 C 19 T 36 k 53 1
3 D 20 U 37 l 54 2
4 E 21 V 38 m 55 3
5 F 22 W 39 n 56 4
6 G 23 X 40 o 57 5
7 H 24 Y 41 p 58 6
8 I 25 Z 42 q 59 7
9 J 26 a 43 r 60 8
10 K 27 b 44 s 61 9
11 L 28 c 45 t 62 +
12 M 29 d 46 u 63 /
13 N 30 e 47 v (pad) =
14 O 31 f 48 w
15 P 32 g 49 x
16 Q 33 h 50 y

以上一共是64个编码,这也是Base64名称的由来,编码的编号对应的是得出的新字节的十进制值。因此,上例中字符串“张3”经过编码后就成了字符串“1iUz”了。

当代码量不是3的整数倍时,代码量/3的余数自然就是2或者1。转换的时候,结果不够6位的用0来补上相应的位置,之后再在6位的前面补两个0。转换完空出的结果就用就用“=”来补位。譬如结果若最后余下的为2个字节的“张”:
字符串“张”
11010101 HEX:D5 11000101 HEX:C5

00110101 00011100 00010100
十进制53 十进制34 十进制20 pad
字符’1’ 字符’i’ 字符’U’ 字符’=’

这样,最后的2个字节被整理成了“1iU=”。
同理,若原代码只剩下一个字节,那么将会添加两个“=”。只有这两种情况,所以,Base64的编码最多会在编码结尾有两个“=”

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/SCHOLAR_II/archive/2009/02/11/3877606.aspx

 

 

Base64编码的加密实在是太简单了,它加密的目的只是为了让传输的内容不是人直接读的,(Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。(The Base64 Content-Transfer-Encoding is designed to represent arbitrary sequences of octets in a form that need not be humanly readable.) ) ,其实根本起不到加密的作用,只要通过一定的算法,很容易破译Base64编码的内容。 其实,Base64编码的主要的作用不在于安全性,而在于让内容能在各个网关间无错的传输,这才是Base64编码的核心作用。由于历史原因,很多网关只允许传送ASCII字符,也就是一个8bit字节的低7位。因此,如果您发送了一封带有非ASCII字符(即8bit字节的最高位是1)的Email通过有“历史问题”的网关时,网关可能会自作主张的把最高位置为0,这样就可能会出现错误!Base64编码将要传输的内容的每个8bit字节的低6位取出来,然后在高2位加0,这样,传输的时候,所有的字节的最高位都是0了,这样,所有的网关都恩那个正确的处理,而不会自作主张的将最高位的1改为0了,这样就保证了传输的内容的无错误性。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

walkingmanc

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值