java 编写一个截取字符串的函数_输入为一个字符串和字节数,Java-编写一个截取字符串的函数,输入为一个字符串和字节数...

首先, Java String是基于Unicode, char是基本单元, 2个字节, 所以楼主你的问题错了. 应该是"输入为一个字符串和char数".

代码:

private String getSubStr(String str, int charCount){

char[] cArr=str.toCharArray();

int idx=0;

for(int count=0;count

if(Character.isHighSurrogate(cArr[idx]))idx++; //如果四字节, 多算一个char

}

return str.substring(0,idx); // substring() 按char计算

}

@Test

public void testtest(){

String str="uDBFFuDFFCabuDBFFuDFFD";

System.out.println("char #: "+str.length());

System.out.println("actual characters: #"+str.codePointCount(0, str.length()));

System.out.println("1 character: "+getSubStr(str,1));

System.out.println("2 character: "+getSubStr(str,2));

System.out.println("3 character: "+getSubStr(str,3));

System.out.println("4 character: "+getSubStr(str,4));

}

结果:

char #: 6

actual characters: #4

1 character: [特殊字符]

2 character: [特殊字符]a

3 character: [特殊字符]ab

4 character: [特殊字符]ab[特殊字符]

更改

楼主你的问题, 是不准确的. Java里, "我"和"A"都是一个char,两个byte.

@Test

public void testC(){

String str="我ABC";

String str1="我ABC汉DEF";

System.out.println("##"+str+"## length:"+str.length());

System.out.println("##"+str1+"## length:"+str1.length());

System.out.println("##"+str+"## codePointCount:"+str.codePointCount(0,str.length()));

System.out.println("##"+str1+"## codePointCount:"+str1.codePointCount(0,str1.length()));

}

结果:

##我ABC## length:4

##我ABC汉DEF## length:8

##我ABC## codePointCount:4

##我ABC汉DEF## codePointCount:8

所以我只能按我的理解给出答案. 如果你真的是想按char数截取又怕有截断,

用Character.isHighSurrogate()判断一下你要取的最后一个char, 如果true, 则substr多取一个char.

更新

当然还有一种情况,不考虑Java的char,String,单纯给一个编码(如gbk)的byte数组,然后按编码规则处理byte数组。这种情况最好拿到c语言环境下讨论,处理是一样的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值