题目要求:编写一个截取字符串的程序,输入为一个字符串和一个字节数字,输出为按字节截取的字符串,保证汉字不被截取半个,如
eg:“我ABC”,4 => 截取“我AB”
eg:“我ABC汉DEF”,6 => 截取“我ABC”,而不是“我ABC”+“汉”的半个
解题思路:那么截取字符串时考虑当前字符是否为汉字的一部分,如果不是汉字则计数字节数直接+1;如果是汉字的一部分,为前半部分时计数字节数不加,如果是汉字的后半部分计数字节数+1
所以设计trimGBK()函数:
public static int trimGBK(byte[] buf, int n){
int num = 0;
boolean bChineseFirstHalf = false;
for(int i=0; i<n; i++){
if(buf[i]<0 && !bChineseFirstHalf)
bChineseFirstHalf = true;
else{
num++;
bChineseFirstHalf = false;
}
}
return num;
}
然后测试:
public static void main(String[] args) throws UnsupportedEncodingException {
String str = "我a爱中华abc";
int num = trimGBK(str.getBytes("GBK"), 5);
System.out.println(str.substring(0, num));//我a爱
int num1 = trimGBK(str.getBytes("GBK"), 6);
System.out.println(str.substring(0, num1));//我a爱
String str1 = "我ABC汉";
int num2 = trimGBK(str1.getBytes("GBK"), 5);
System.out.println(str1.substring(0, num2));//我ABC
int num3 = trimGBK(str1.getBytes("GBK"), 6);
System.out.println(str1.substring(0, num3));//我ABC
}