java(16)--中英文混合,截取一定长度,保持不乱码

因为中文是两个字节,如果需要截取一定字符长度,比如短信字数,所以需要保证其不乱码

import java.io.UnsupportedEncodingException;

public class Demo {

    /**
     * gb2312  gbk 区别
     * gb2312 码表 兼容了一个 ascii码表 ascii字符占一个字节(正数)  中文占两个字节(两个负数)
     * 升级gbk码表  和上面一样, 不同在于: 中文 第一个字节是负数 第二个可正可负
     * @throws UnsupportedEncodingException 
     */
    public static void main(String[] args) throws UnsupportedEncodingException {
String str = "abc中国人";

        byte[] buf = str.getBytes("gbk");   // ctrl+2,L

        // 截取数组的一部分,要求保留完整的中文
        //decode(buf,8);

        decodeByGBK(buf, 6);
    }
    private static void decodeByGBK(byte[] buf, int len) {
        // gbk 编码
        boolean b = false;      // b true
        for(int i=0; i<len; i++) {
            if(b)
                b = false;
            else if(buf[i]<0)
                b = true;
        }
        if(b)
            len--;
        String str = new String(buf, 0, len);
        System.out.println(str);
    }

    private static void decode(byte[] buf, int len) {
        // 统计负数的个数
        int count = 0;
        for(int i=0; i<len; i++) {
            if(buf[i]<0)
                count++;
        }
        if(count%2==1)
            len--;

        String str = new String(buf, 0, len);
        System.out.println(str);
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值