GBK编码,一个汉字占两个字节,英文字母占两个字节。
UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节,英文字母占两个字节。
UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16),英文字母占两个字节。
UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16),英文字母占两个字节。
unicode 汉字占2~4个字节,英文字母占两个字节。
try {
System.out.println("占用内存大小:"+"测试adbc".getBytes("UTF-8").length);
System.out.println("占用内存大小:"+"测试adbc".getBytes("GBK").length);
System.out.println("占用内存大小:"+"测试adbc".getBytes("Unicode").length);
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
//输出
占用内存大小:10
占用内存大小:8
占用内存大小:14