public class Demo {
public static void main(String[] args) throws Exception{
String srcStr1 = "我ABC";
String srcStr2 = "我ABC汉DEF";
int num = trimGBK(srcStr1,1);
System.out.println("数字:"+num);
System.out.println(srcStr1.substring(0,num) );
int num2 = trimGBK(srcStr2,100);
System.out.println("数字:"+num2);
System.out.println(srcStr2.substring(0,num2) );
}
//
public static int trimGBK(String srcstr,int n) throws Exception{
if(srcstr==null&&"".equals(srcstr)){
System.out.println("输入的字符串不能为空");
return 0;
}
byte[] buf=srcstr.getBytes("GBK");
int num=0;
int buflength=buf.length;
boolean bChineseFirstHalf=false;
if(n>buflength){
n=buflength;
for(int i=0;i<n;i++){
if(buf[i]<0&&!bChineseFirstHalf){
bChineseFirstHalf=true;
}else{
num++;
bChineseFirstHalf=false;
}
}
}else{
for(int i=0;i<n;i++){
if(buf[i]<0&&!bChineseFirstHalf){
bChineseFirstHalf=true;
}else{
num++;
bChineseFirstHalf=false;
}
}
}
return num;
}
}
1.编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串。 但是要保证汉字不被截半个,如“我ABC”4,应该截为“我AB”,输入“我ABC汉DEF”,6,应该输出为“我ABC”而不是“我ABC+汉的半个”。
注意的问题: 1) 按字节截取字符串,首先明白多种编码格式占用的字节数,中文UT-8 编码 中文占用3个字节,中GBK编码 中文占用2 个字节。
2)中文的字节对应的<0
3)字符串操作应该都要面对的一个问题,字符串是否有效null ,和""
4)思路 :将2 个字节作为一个数,算出要解毒字符串的长度
代码如下