看面试程序时候看到一个这样的题目,自己用最基础的方式实现了一下。
题目:
截取一个字符串的函数,输入为一个字符串和字节数,输出为为按字节截取的字符串,但是要保证汉字不会被截半个,
如 “我ABC” 4,应该被截为“我AB”:输入“我ABC汉DEF”,应该输出为“我ABC”而不是“我ABC”+汉的半个。
题解:
/**
* 截取字符串方法
* @param str
* @param offset
* @return
* @throws UnsupportedEncodingException
*/
public static String mySubstr(String str, int offset) throws UnsupportedEncodingException {
byte[] bytes = str.getBytes("GBK");
byte[] newByte = new byte[bytes.length];
for (int i =0; i < bytes.length; i++) {
if (i==offset-1) {
if (bytes[i] < 0) { //如果是负数,说明中文字符被截断了
break;
}else {
newByte[i] = bytes[i];
break;
}
}
newByte[i] = bytes[i];
}
return new String(newByte);
}
说明:由于在编译器中默认是UTF-8格式,所以会出现中文占用为三个字节的问题,所以我在代码中将字符转为byte数组时候转为GBK的,这样的结果就是正确的。