首先, Java String是基于Unicode, char是基本单元, 2个字节, 所以楼主你的问题错了. 应该是"输入为一个字符串和char数".
代码:
private String getSubStr(String str, int charCount){
char[] cArr=str.toCharArray();
int idx=0;
for(int count=0;count
if(Character.isHighSurrogate(cArr[idx]))idx++; //如果四字节, 多算一个char
}
return str.substring(0,idx); // substring() 按char计算
}
@Test
public void testtest(){
String str="uDBFFuDFFCabuDBFFuDFFD";
System.out.println("char #: "+str.length());
System.out.println("actual characters: #"+str.codePointCount(0, str.length()));
System.out.println("1 character: "+getSubStr(str,1));
System.out.println("2 character: "+getSubStr(str,2));
System.out.println("3 character: "+getSubStr(str,3));
System.out.println("4 character: "+getSubStr(str,4));
}
结果:
char #: 6
actual characters: #4
1 character: [特殊字符]
2 character: [特殊字符]a
3 character: [特殊字符]ab
4 character: [特殊字符]ab[特殊字符]
更改
楼主你的问题, 是不准确的. Java里, "我"和"A"都是一个char,两个byte.
@Test
public void testC(){
String str="我ABC";
String str1="我ABC汉DEF";
System.out.println("##"+str+"## length:"+str.length());
System.out.println("##"+str1+"## length:"+str1.length());
System.out.println("##"+str+"## codePointCount:"+str.codePointCount(0,str.length()));
System.out.println("##"+str1+"## codePointCount:"+str1.codePointCount(0,str1.length()));
}
结果:
##我ABC## length:4
##我ABC汉DEF## length:8
##我ABC## codePointCount:4
##我ABC汉DEF## codePointCount:8
所以我只能按我的理解给出答案. 如果你真的是想按char数截取又怕有截断,
用Character.isHighSurrogate()判断一下你要取的最后一个char, 如果true, 则substr多取一个char.
更新
当然还有一种情况,不考虑Java的char,String,单纯给一个编码(如gbk)的byte数组,然后按编码规则处理byte数组。这种情况最好拿到c语言环境下讨论,处理是一样的。