1.ASCII
最古老,纯英文字符集,一个字节,使用前7位。最高位为0,用来扩展的。128个英文字符。
凡是键盘能直接打出来的字符都是英文字符集。一共只有128个。
26*2=52 + 标点符号+ .;+-().$ = 128
ASCII字符集纯英文字符,只支持英语,占一个字节。
2^8=256个
留出一半,以供将来的扩展。
2.ISO_8859_1
西欧字符集,西方文字的字符集,一个字节,最高位1,低七位和ASCII完全兼容。256西方字符。
欧洲 德国,法国,俄国把英文,德文,法文,俄文统称为西方字符集。
ISO_8859_1 别名 latin_1 占一个字节。
3.GB2312
国标码:简体中文的字符集,6000多个汉字。
4.GBK
国标码的扩充码:表示中华民族所有的汉字,包括简体的,繁体,甲骨文,篆书。。。,两多个。两个字节
5.BIG5
台湾和香港指定繁体中文的字符集。一万多个繁体中文。两个字节。
注意:GBK和BIG5都是两个字节,表示所有的繁体字,但是二者没有任何的转换关系,编码各不相同。 GBK,大陆,BIG5,香港台湾。
6.unicode
支持世界所有语言文字字符集,两个字节。unicode中文字符集和gbk不兼容。
unicode好在什么地方呢:ASCII和ISO_8859_1和unicode是兼容。
Unicode字符集究竟是个什么字符集
可变长度的。1-6个字节不等。
西方文字占1个字节,中文占2个字节
7.utf-8
utf-8是unicode编码的存储编码,可变长度的。1-6个不等。
纯英文:1个字节。
西欧文字(法文,德文,俄文)ISO_8859_1:2个字节。
汉字:三个字节。