url编码和utf8以及unicode的东东

为什么要url编码

  • 为了安全的传输url
  • 除了 一下5类字符,其余的都要编码, RFC3986
  1. 0-9
  2. a-Z
  3. 、-_.~4 (4个字符)
  4. ! * ’ ( ) ; : @ & = + $ , / ? # [ ] (这些是保留字符,路径分隔,参数分隔等作用)
  5. ~ 波浪线虽然不要求编码,但一些老网关或代理会编码。
  • 0 -127 这128个ascii表:
    • 00~1F + 7F 这32个是控制字符。
    • 20~7E 都是可见字符。

怎么编码

  • 16进制表示形式,一个字节一个字节的表示 前面用百分号。
  • 不要求编码的字符可以不编码,编码了也不影响, 比如a %61
  • 中文按字节表示 比如 “中” 三个字节0xE4 0xB8 0xAD, 就是 %E4%B8%AD

utf8编码

  • unicode是字符集,是字符集,字符集, utf8才是具体实现, 为什么呢?unicode规则太占空间了。 参考此文
  • 第一位是0. 表示单字节字符
  • 前面几个1,则表示utf8需要几个字节
  • 第一个字节n(表示整体几个字节)个1 + 0 , 后面的字节前两位都是10,其余部分就是unicode编码对应的填充。

unicode编码是大端还是小端

  • 一般计算都是小端, 低地址存低位,高地址存高位
  • 网络传输,文件存储 是大端, 低地址存高位。这个利于人理解,地址一般是从低到高,例如顺序0x1234。
  • unicode文本开头有个字符,FEFF是小端,FFEF是大端。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值