Go语言 Base64编码原理及使用

在网络中传递参数时,我们经常会对参数进行Base64编码,那么Go 语言中如何进行Base64编码呢?Base64编码的原理是怎样的呢?通过这篇文章一起来了解下吧!

Go代码 Base64编码(标准Base64编码、Base64 URL 编码)

package main
 
import (
"encoding/base64"
"fmt"
)
 
func main() {
// 标准Base64编码
src := "hello world"
res :=base64.StdEncoding.EncodeToString([]byte(src))
fmt.Println(res) //aGVsbG8gd29ybGQ=
 
// 标准Base64解码
s, err :=base64.StdEncoding.DecodeString(res)
fmt.Println(string(s), err) //hello world
 
// Base64 URL 编码
src2 := "信息"
res2 :=base64.URLEncoding.EncodeToString([]byte(src2))
fmt.Println(res2) // 5L-h5oGv
 
// Base64 URL 解码
s2, err2 :=base64.URLEncoding.DecodeString(res2)
fmt.Println(string(s2), err2) // 信息 <nil>
}

什么是Base64编码

Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,是一种基于64个可打印字符来表示二进制数据的方法。Base64编码是从二进制到字符的过程,可用于在HTTP环境下传递较长的标识信息。采用Base64编码具有不可读性,需要解码后才能阅读。—百度百科

通过百度百科的介绍,我们可以获得如下信息:

  • Base64是一种编码方式,将二进制编码为字符

  • Base64编码后的字符范围为64个可打印字符

  • 编码后的结果具有不可读性,需要解码:即Base64不是加密方法,而是编码方式,是从一种语言翻译为另一种语言,当然也可以翻译回去

为什么需要Base64编码

我们都知道计算机的世界,是由0和1组成的,那么0和1的组合如何表示现实语言呢,这就出现了ASCII 码。ASCII是由美国设计的,一共128个字符,其中规定了第0~31及127(共33个)是控制字符或通信专用字符,32~126(共95个)是可打印字符。比如10(00001001)表示换行,65(0100 0001)表示大写字母A。

最初的许多协议都是基于 ASCII 设计的,只能传输可打印字符。比如发邮件时使用的 SMTP(简单邮件传输协议),最初只能传输纯文本,对图片、语音等二进制文件的支持并不是太好。

那么我们想传输这些包含不可打印字符的数据怎么办,一种方式就是设计一种编码方式,将不可打印字符转为可打印字符,这样这些数据就可以传输了,收到这些数据后,再解码回来,得到原始数据。Base64就是为了解决这个问题的。

对于现在的协议来说,都针对二进制文件做了处理,但我们无法保证文件在网络传输过程中不出现问题。当包含不可打印字符的文件在网络中传输时,往往要经过多个路由设备,由于不同的设备(特指老的路由设备)对字节流的处理方式有一些不同,这样那些不可打印字节就有可能被错误处理,不利于数据传输的。所以就先把数据先做一个编码,统统变成可见字节,确保数据可靠传输。

Base64编码原理

Base64之所以叫做Base64,是因为它是基于64个可打印字符设计的,这64个字符是 ASCII编码中可打印字符的子集,包含26个字母的大小写、10个阿拉伯数字、'+‘号 和 ‘/‘号。(其实还有一个 ‘=’ 号用于后缀)

编码步骤

由于一共有 64 个字符,那么使用 6 个比特位就足够表示了(2的6次方=64),而 ASCII码 使用 8 个比特位表示一个字符,6 和 8的最小公倍数为 24,3个 ASCII码 字符可以编码为 4 个 Base64 字符。因此Base64的编码过程如下:

  1. 将原始数据每三个字节分为一组,一共24个比特位

  1. 将24个比特位分为4组,每组6个比特位

  1. 计算每组的十进制值,根据编码对照表,得到可打印字符串

以维基百科上举的例子做个演示:

  1. 给定单词 ‘Man’,一共三个字节

  1. 根据ASCII编码,得到24个比特位

  1. 6个一组,分为4组

  1. 计算每组的十进制值分别为 19、22、5、46,对照Base64编码表,得到可打印字符串为 ‘TWFu’

需要注意的是,使用Base64编码后,3个字节会转为4个字节,编码后的需要传输的数据比编码前多了 1/3。

位数不足情况

位数不足会有两种情况:两个字节或者一个字节的数据。

如果是两个字节,也就是16个比特,需要补两个0,得到三个Base64编码字符,最后添加一个’=‘用于补充

如果是一个字节,也就是8个比特,需要补4个0,得到两个Base64编码字符,最后添加两个’=‘用于补充

Base64解码原理

解码就是编码的逆向操作:

  1. 去掉结尾的’=‘号

  1. 根据Base64编码表,找到每个字符对应的编码值

  1. 取每个编码值的后6位,形成二进制串

  1. 对上述二进制串,每8个构成一个字节,如果最后一组不够8个,一定全是0,丢弃掉

  1. 此时得到的就是原始数据的二进制编码,再根据编码方式(例如 ASCII )等进行解码

例如对于上述 ‘Ma’ 的编码值 ‘TWE=’ 进行解码:

  1. 去掉’=',得到 ‘TWE’

  1. ‘T’:19,‘W’:22,‘E’:4

  1. 010011 010110 000100

  1. 01001101 01100001

  1. M a

Base64标准编码变种

我们有时候会将Base64编码后的字符串,当前 HTTP URL 中的参数进行传递,但是标准的 Base64并不适合直接放在URL里传输,因为对于 ‘+‘号,使用url encode时会被encode 为空格,比如编码后的值是 ‘ab+cd’,但是使用urlencode 后变成了 ‘ab cd’,那么对方接收到的也是’ab cd’,此时再解码肯定失败了。

为解决此问题,衍生出一种用于URL的改进Base64编码,它不仅在末尾去掉填充的’=‘号,并将标准Base64中的“+”和“/”分别改成了“-”和“_”。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值