不同的编码字节个数不一样的【以下列举常见三种编码形式】:
- GBK:一个汉字等于2字节,一个字母就等于1个字节,操作符等于1个字节。
- UTF-8:一个汉字等于3个字节,中文句号‘。’等于3个字节,一个字母等于1字节,英文的句号‘.’等于1个字节
- Unicode:一个汉字等于4个字节,都是等于2个字节【英语,数字,操作符[。,%,&]等的呢】
public static void main(String[] args) {
// 得到当前的系统属性
String encoding = System.getProperty("file.encoding");
System.out.println("当前编码:" + encoding);
try {
String str = "字符串abc";
int len = str.getBytes().length;
System.out.println("1.按操作系统默认编码来编码:" + len);
len = str.getBytes("GBK").length;
System.out.println("2.GBK编码的字节数:"+ len);
len = str.getBytes("UTF-8").length;
System.out.println("3.UTF-8编码的字节数:" + len);
len = str.getBytes("Unicode").length;
System.out.println("4.Unicode编码的字节数:" + len);
/*
* 当前编码:UTF-8
* 1.按操作系统默认编码来编码:5
* 2.GBK编码的字节数:4
* 3.UTF-8编码的字节数:5
* 4.Unicode编码的字节数:8
*/
} catch ( java.io.UnsupportedEncodingException e) {
System.out.println(e.getMessage().toString());
}
}