Java中根据字节截取字符串

一、简介                      

  为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

  代码点值:与Unicode编码表中字符相对应的代码值;

  代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

二、根据字节截取字符串的代码实现                  

  public String getSubString(String str, int length) throws Exception {

    int i;

    int n;

    byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

    i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

    n = 0;

    for(; i < bytes.length && n < length; i++) {

      if(i % 2 == 1) {

        n++;

      } else {

        if(bytes[i] != 0) {

          n++;

        }

      }

    }

    //去掉半个汉字

    if(i % 2 == 1) {

      if(bytes[i-1] != 0) {

        i = i -1;

      } else {

        i = i + 1;

      }

    }

 

    return new String(bytes, 0, i, "Unicode");

  }

转载于:https://www.cnblogs.com/lmmblogs/p/7813132.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值