各种编码了解

编码

  1. ASCII编码:美国信息交换标准代码 占用一个字节
  2. GB2312:1981年发布的简体中文汉子编码国家标准,共收集7445个图形字符,其中包括6763个汉字
  3. BIG5:台湾地区繁体中文标准字符集,共收录13053个汉字
  4. GBK编码:2000年3月17日发布的,共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字
  5. Unicode编码:国家标准字符集,他将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言,跨平台的文本 信息交换,Unicode只是一组字符设定或者说是从数字和字符之间的逻辑映射的概念编码,但是它并没有指定代码点如何在计算机上存储,在Unicode官方资料中,Unicode的编码方式有三种 [3]:UTF-8、UTF-16、UTF-32。由于UTF-8与字节序无关(无需BOM),同时兼容ASCII编码,使得UTF-8编码成为现今互联网信息编码标准而被广泛使用。
  6. UTF-8是针对Unicode的一种可变长度的字符编码,它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部分修改后,便可继续使用,1-4个字节

汉字所占字节

汉字占用字节:GBK编码,一个汉字占两个字节。 UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。UTF-16 统一采用两个字节表示一个字符。

(1)url编码别名百分号编码(用户url中传输数据)
%E4%BD%A0%E7%8C%9C%E7%8C%9C是汉子进行url编码之后的样子,可以使用urldecode进行解码。

(2)base64为编码
基于64个可见字符将二进制编码为可见字符,6个bit表示一个可见字符,base64不能直接用于url传输,在传输过程中+和/会被转义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值