字符集编码
1. ASCII
ASCII:美国信息交换标准代码,包括了英文、符号等。
标准ASCII使用1个字节存储一个字符,首尾是0,总共可表示128个字符。
2. GBK
GBK:汉字内码扩展规范、国标
汉字编码字符集包括了2万多个汉字等字符,GBK中一个中文字符编码成两个字节的形式存储。
注意:GBK兼容了ASCII字符集。
GBK规定:汉字的第一个字节的第一位必须是1
3. UTF-8
Unicode字符集(统一码,也叫万国码)
- Unicode是国际组织制定的,可以容纳世界上所有文字、符号的字符集。
UTF-32:用4个字节表示一个字符。缺点:占存储空间,通信效率变低。
UTF-8
-
是Unicode字符集的一种编码方案,共分四个长度区:1个字节,2个字节,3个字节,4个字节
-
英文字符、数字等只占1个字节(兼容标准ASCII编码),汉字字符占用3个字节。
重点: