Base64编码:
https://blog.csdn.net/wufaliang003/article/details/79573512
64种可打印字符,表示原二进制格式中的6bit;
Base64编码有一张编码表(解码的时候也用它),0~63的id映射到可打印字符;
6bit*4=8bit*3,所以4个字符一组,表示3个8-bit二进制子节;
原二进制子节数不为3个倍数时:
原字节缺1个,则编码为3个字符(第3个字符末2位补0)和1个=;原字节缺2个,则编码为2个字符(第2个字符末4位补0)和2个=;
解码时,末尾有几个=,就说明最后一组对应的原子节是几个(0个=对应3个原子节,1个=对应2个原子节,2个=对应1个原子节)
Unicode/UTF-8编码
https://blog.csdn.net/Deft_MKJing/article/details/79460485
Unicode是2个子节;(ASCII是1个字节,0~127,最高位肯定是0)
UTF-8是Unicode的一种实现方式,他可以让含有ASCII码字符的文本变的比Unicode编码的要短,用1~4个子节来编码,ASCII码的字符就是一个子节且编码保持不变; n>1时,n个子节的编码,首子节最高位是n个1+0,后面n-1个子节最高位都是10;剩余位从低到高用Unicode填充,最高位补0;