编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串。但是要保证汉字不被截半个,如"我ABC"4,应该截为"我AB",输入"我ABC汉DEF",6,应该输出为"我ABC"而不是"我ABC+汉的半个"。
因为汉字占两个字节,所以需要一个一个字节来判断。(GBK编码格式)
public String SubStr(String str, Integer index) throws UnsupportedEncodingException {
if (str == null) {
return null;
}
if (index == 0) {
return "";
}
StringBuilder sb = new StringBuilder();
//转换为字节数组
byte[] gbks = str.getBytes("GBK");
//转换为字符数组
char[] chars = str.toCharArray();
//用于取值
int j = 0;
//用于判断汉字前后部分
int count = 0;
for (int i = 0; i < gbks.length; i++) {
byte b = gbks[i];
if (i == index) {
break;
}
//判断是否是字节是否是汉字一部分
if (!(b >= 0 && b <= 127)) {
//如果是。并且没有记录,则计为前个汉字,并跳出本次循环拼接,字符索引不进行增加
if (count == 0) {
count++;
continue;
//如果是汉字的后半部分,则进行拼接,并重置记录
} else {
sb.append(chars[j]);
j++;
count = 0;
continue;
}
}
//普通字符的拼接
sb.append(chars[j]);
j++;
}
return sb.toString();
}