UrlEncode Url编码
- Url编码的原因
- 移植性:为了在不同的因特网协议中完整的传输url
- 阅读性:为了url能够供人类阅读
- 完整性:为了url能够完整使用安全字母表以外的二进制数据和字符
Url编码机制
- 编码核心:1、对不安全字符进行转义处理;2、将不安全字符转义为一个百分号(%),后面跟着两个表示字符ASCⅡ码的十六进制数。
字符:~ ASCⅡ码:126(0x7E) URL编码:http://www.joes-hardware.com/%7Ejoe
字符:% ASCⅡ码:37(0x25) URL编码:http://www.joes-hardware.com/100%25satisfy
- Url字符限制
- url保留字符(类似语法关键字),如:’/’(路径分隔符), ‘.’(路径组件中使用), ‘:’(方案、用户/口令等定界符)等;
- 不在定义的ASCⅡ码可打印字符集中,如0x00~0x1F, >0x7F;
- 可能与网关及协议产生混淆的字符,如’{}’, ‘\’, ‘[]’等;
Base-64 编码
- Base-64编码的原因
- Base-64编码是MIME标准的一部分
- 可使MIME在smtp中传输任意数据
- 将任意数据打包,将其作为HTTP首部字段的值发送出去,无须担心其中包含会破坏HTTP分析程序的冒号、换行符或二进制值
Base-64编码机制
- 将原始8位字节拆分为6位的片段,序列末尾填充零位(最终二进制序列的长度成为24的倍数);
- 任何完全填充(不包含原始数据中的位)的6位组都由”=”表示;
- 由于Base-64编码用8位字符来表示信息中的6个位,所以Base-6编码字符串大约比原始值扩大了33%。
8位字符 O W !
8位值(16进制) 0x4F 0x77 0x21
8位值(2进制)010011110111011100100001
6位值(10进制) 19 55 28 33
Base-64字符 T 3 c h
Base-64字母表包括A~Z、a~z、0~9、+、/,如果对这64个字符进行特定排序,就可以实现简单的数据加密