1).ASCII编码
它有256个字符,用于表示很多符号和字母、数字
2).ISO8859-1
这个字符集叫西欧字符集。
3).gb2312
这个收集了中文字符集
4).gbk
它扩展了gb2312,包括了更多的类似中文的字符集
5).gb1830
扩展了gbk,也就包含了更多的字符。
6).unicode
Unicode,它综合了所有国家的字符,统一用两个字节的大小来保存字符,这样就能存储65536(2的十六次方)个状态,也就能存储世界上所有的字符。
7).UTF-8
由于西欧字符集使用的ISO8859-1,它的字符占一个字节,而Unicode占了两个字节,所以出现了UTF-8格式。
utf-8用于网络传输或存储,它会动态地存储字符,用1-4个字节。比如‘a’,就占一个字节,复杂的汉字就占两个字节,更复杂的就占4个字节。
8). 而且ASCII码被扩展至Unicode的前256个字符
我们可以用字节地址和长度来查找,例如:
String str="中";
byte[] bytes=str.getBytes();
for(byte b:bytes){
println(b);//会打印存储“中”,这个字的byte是-42和-48
}
byte[] bytes2={-42,-48};
String str2=new String(byte);
println(str2);//也可以把bytes2数组转换成"中"