Base-x 编码的奥秘

Thoughtworks思特沃克中国

于 2021-02-19 10:16:30 发布

阅读量359

点赞数

本文链接：https://blog.csdn.net/toafu/article/details/113858302

版权

本文介绍了Base编码的历史和用途，包括Base64在邮件传输中的应用，Base58在Bitcoin中的重要性，以及Base编码的特点。Base64通过将3字节转换为4个ASCII字符解决传输问题，而Base58则去除了易混淆字符，提高比特币地址的可读性。

摘要由CSDN通过智能技术生成

摘要

Base 编码那么多，都是用来干什么的？

Base Encoding 是一组二进制转文本的编码模式（Encoding Scheme），常见的有 Base64、Base58、Base32、Base16。大家不仅疑惑为什么需要二进制转文本这种编码模式呢？常见误解之一就是既然所有的编码最终都会变成 0 和 1，那么分成 ASCII 和 Base64 编码是不是就没有必要呢？

Base 编码的历史

1970~1980 年代，DEC（和其他公司）生产的“微型计算机”使用的字符编码为 ASCII。每个字节使用 7 位，给出 128 个可用值。这足以满足大写和小写拉丁字母，数字，标点，一些常见的数学符号，货币符号和控制字符的需要。此后 ASCII 变得非常流行，并在很长一段时间内占主导地位。ASCII 规定了范围在 [0,127] 之间的字符编码，其中 [0, 31] 以及 127 (del) 这 33 个属于不可打印的控制字符（可以使用 man ascii 查证）。互联网的杀手级应用——电子邮件系统当初是为了传输 7 位 ASCII 文本而设计的，于是在传输信息时，有些邮件网关会把 [0,31] 这些控制字符给清除，而有些会替换 10 (newline 或 \n）和 13 (carrige 或 \r) 字符，有些更加粗暴地将二进制的最高位清空，还有的程序在收到 [128, 255 ] 之间的国际字符会发生错误。

如何在不同邮件网关之间安全地传输控制字符、国际字符和二进制文件呢？作为 MIME（RFC 2045 和 RFC 3548）多媒体电子邮件标准的一部分的 Base64 编码就被开发出来了。

Base64 编码的解题思路很简单。既然直接传输控制字符、国际字符和二进制文件容易造成原始信息在传递过程中的错误，那么就把原始信息都转成 ASCII 的可打印字符，这样就能让旧系统安分点，不再胡乱改变