字符集:计算机底层只能保存二进制码。为了保存字符,为每个字符编号———这个编号,即为“字符集”。
ASCII–美国人编的。
总共只有100多个,因此认为0~255即可,因此ASCII占8位。
A-65、Z-65+25
a-97、z-97+25
0-48、9-57
GB2312–中文字符集。同时也兼容ASCII。
GBK --汉字更多。(通常一个汉字占2个字节)
GB18030–目前使用的汉字字符集。
Unicode:美国人制定了兼容所有国家文字的字符集(Java使用的就是这个字符集)
Unicode的一些变种:
UTF-8(一个汉字占1-4不等个字节,大部分汉字占3个字节)
UTF-16(大部分一个汉字占2个字节,少部分少见的占4个字节)
注:一般来说,企业开发中推荐使用UTF-8。