概述:
ASCII:英语系编码 0~127,1个字节,高位为0,满足英语系使用,及常规键盘上的所有基本按键。
非ASCII:欧洲系编码,加入了对注音符号等的控制。1个字节,高位可以为1,为0时跟ASCII保持一致,为1时则为非ASCII码,0-255。
Unicode:(统一码、万国码、单一码):为了实现全世界所有字符唯一性的一套编码集,1990年开始研发,1994年正式公布,但很长时间内没有被全世界采用,直到互联网的诞生,才开始使用Unicode中的UTF-8规则。
UTF-8:是一种针对Unicode字符编码的可变长度字符编码协定。
UTF-16:比起UTF-8,好处在于大部分字符都以固定长度的字节 (2字节) 储存,但UTF-16却无法兼容于ASCII编码
UTF-32:是一种针对Unicode字符编码的4字节长度编码协定。
UTF编码
|
Byte Order Mark (BOM)
|
UTF-8 without BOM | 无 |
UTF-8 with BOM
|
EF BB BF
|
UTF-16LE
|
FF FE
|
UTF-16BE
|
FE FF
|
UTF-32LE
|
FF FE 00 00
|
UTF-32BE
|
00 00 FE FF
|
下面是一些详细的介绍