常见的编码方式及特征

一、BASE编码

1、Base64

Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。

Base64,就是包括小写字母a-z、大写字母A-Z、数字0-9、符号"+“、”/"一共64个字符的字符集。

(1)编码规则

①把3个字节变成4个字节。

②每76个字符加一个换行符。

③最后的结束符也要处理

(2)举例说明

转前: s 1 3

先转成ascii:对应 115 49 51

2进制: 01110011 00110001 00110011

6个一组(4组) 011100110011000100110011

然后才有后面的 011100 110011 000100 110011

然后计算机一个字节占8位,不够就自动补两个高位0了

所以有了高位补0

科学计算器输入 00011100 00110011 00000100 00110011

得到 28 51 4 51

查对下照表 c z E z

原文的字节数量应该是3的倍数,如果这个条件不能满足的话,具体的解决办法是这样的:原文剩余的字节根据编码规则继续单独转(1变2,2变3;不够的位数用0补全),再用=号补满4个字节。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为一个原字节至少会变成两个目标字节,所以余数任何情况下都只可能是0,1,2这三个数中的一个。如果余数是0的话,就表示原文字节数正好是3的倍数(最理想的情况)。如果是1的话,转成2个Base64编码字符,为了让Base64编码是4的倍数,就要补2个等号;同理,如果是2的话,就要补1个等号。

转前: s 1

先转成ascii:对应 115 49

2进制: 01110011 00110001

6个一组 011100 110011 000100

高位补0

科学计算器输入 00011100 00110011 00000100

得到 28 51 4

查对下照表 c z E

等号补满4个字节c z E =

(3)编码特征

末尾有一个或两个=,由大小写字母,+,/符号组成,示例如下

6I+c5qC5572R5ZKv5a6J5YWo5p2C6LCIQ2FpZ2Vuc2Vj
5pyr5bC+5pyJ5LiA5Liq5oiW5Lik5LiqPe+8jOeUseWkp+Wwj+WGmeWtl+avje+8jCvvvIwv56ym5Y+357uE5oiQ77yM56S65L6L5aaC5LiLLg==

2、Base32

Base32使用了ASCII编码中可打印的32个字符(大写字母AZ和数字27)对任意字节数据进行编码

(1)编码规则

输入:任意长度的二进制数据。

转换:将二进制数据每5位分为一组,每组转换为对应的base32字符。如果最后不足5位,则用0填充。

输出:由base32字符组成的字符串,通常包含等号(=)作为填充标记。

(2)编码特征

只包含大写字母和数字2-7,末尾有=

3、Base16

base16编码,使用16个字符(0-9和A-F)来表示二进制数据。

(1)编码规则

输入:任意长度的二进制数据。

转换:将二进制数据每4位分为一组,每组转换为对应的十六进制字符。

输出:由十六进制字符组成的字符串。

(2)编码特征

只包含数字和A-F字母。

二、URL编码

‌URL编码‌是一种将URL中的特殊字符转换为可被浏览器和服务器接受的ASCII字符的编码方式。

1、编码规则

  1. ‌将字符转换为其ASCII码值‌:例如,字符A的ASCII码值是65。
  2. ‌将ASCII码值转换为十六进制数‌:例如,65转换为十六进制数是41。
  3. ‌在十六进制数前面加上%符号‌,得到URL编码。例如,字符A的URL编码是%41

2、编码特征

(1)常见的编码

空格 %20

%:23

&:%26

+:%2B

%:%25

?:%3F

/:%2F

=:%3D

,:%2C

$:%24

":%22

':%27

(2)编码特征

%后跟两个字符,数字或字母,示例:

user%3D1%27%20or%201%3D1

三、Uicode编码

Unicode 是国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换.

Unicode包含UTF-8、UTF-16、UTF-32,不过我们这里不需要深入了解,只需要碰到Unicode编码的时候能认出来就行。

1、编码特征

\u开头,后跟数字,比如

Caigensec的Unicode编码为\u0043\u0061\u0069\u0067\u0065\u006e\u0073\u0065\u0063

### Base64加密方式的特点 Base64是一种基于64个可打印字符来表示二进制数据的编码方法[^1]。这种编码方式并不是为了提供安全性,而是主要用于解决传输过程中可能出现的数据损坏或丢失问题。 #### 编码原理 Base64通过将三个字节转换成四个ASCII字符的方式工作。具体来说: - 输入数据被分割成每组24位(即3个8位字节) - 这些24位再细分为四部分,每一部分为6位 - 每个6位序列映射到一个特定范围内的ASCII字符表中的位置,形成最终输出字符串的一部分 ```python import base64 original_data = b'example' encoded_data = base64.b64encode(original_data) print(encoded_data.decode('utf-8')) ``` 此过程确保了即使在网络上传输时遇到特殊字符处理不当的情况,也可以保持原始数据不变形。 #### 特征总结 - **非保密性**:Base64并不属于真正的加密技术;它只是简单地改变了数据的表现形式,并未增加任何实质性的保护措施。 - **体积增大**:经过Base64编码后的文本会比原文件大约三分之一左右。 - **广泛适用性**:适用于多种场景下的数据编码需求,特别是当需要在只支持7-bit ASCII字符集环境中传递任意类型的二进制信息时非常有用。 ### Base64的主要用途 - **电子邮件附件**:MIME协议规定,在发送邮件时如果包含非纯文本的内容,则需采用Base64或其他类似的机制来进行适当编码。 - **URL参数嵌入**:有时为了让某些复杂结构能够作为查询串的一部分而不会引起解析错误,也会利用Base64进行预处理。 - **图像内联显示**:网页开发中可以直接把图片转成Base64格式并直接写入HTML标签里,从而减少HTTP请求次数提高加载速度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值