我经常遇到计算包含汉字字符串长度的情况,如果直接使用str.length()计算,得出的长度往往是不准确的。这是因为:
在Java中:
1字符=2字节,1字节=8位
英文和数字占一个字节,中文占2个字节。
例如:
public static void main(String[] args) {
String str= "Great大中国";
int length = str.length();
System.out.println(length);
}
计算结果为8,是错误的。
正确计算方法如下:
public static int getStrlength(String str) {
int strLength = 0;
String chinese = "[\u0391-\uFFE5]";
/* 获取字段值的长度,如果含中文字符,则每个中文字符长度为2,否则为1 */
for (int i = 0; i < str.length(); i++) {
/* 从字符串中获取一个字符 */
String temp = str.substring(i, i + 1);
/* 判断是否为中文字符 */
if (temp.matches(chinese)) {
/* 中文字符长度为2 */
strLength += 2;
} else {
/* 其他字符长度为1 */
strLength += 1;
}
}
return strLength;
}
测试代码:
public static void main(String[] args) {
String str= "Great大中国";
int length = getStrlength(str);
System.out.println(length);
}
计算结果为11,结果正确。