Java 分割字符串---按字节长度分割带有中文字符串

中文在不同编码中占用的字节数是不同的,GBK编码中,一个汉字占两个字节,UTF-8编码格式中,一个汉字占3个字节。

public static List<String> chineseSplitFunction(String src,String byteType, int bytes){        
        if(src == null){            
            return null;            
        }            
        List<String> splitList = new ArrayList<String>();    
        int startIndex = 0;    //字符串截取起始位置            
        int endIndex = bytes > src.length() ? src.length() : bytes;  //字符串截取结束位置             
        try {
            while(startIndex < src.length()){                
                String subString = src.substring(startIndex,endIndex);                //截取的字符串的字节长度大于需要截取的长度时,说明包含中文字符    
                //在GBK编码中,一个中文字符占2个字节,UTF-8编码格式,一个中文字符占3个字节。                
                while (subString.getBytes(byteType).length > bytes) {                    
                    --endIndex;                
                    subString = src.substring(startIndex,endIndex);            
                }                
                splitList.add(src.substring(startIndex,endIndex));                
                startIndex = endIndex;                
                //判断结束位置时要与字符串长度比较(src.length()),之前与字符串的bytes长度比较了,导致越界异常。        
                endIndex = (startIndex + bytes) > src.length() ? src.length()  : startIndex+bytes ;        
            }
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }            
        return splitList;        
    }

public static void main(String[] args) {
        String chineseString = "attr统计时间";    
        List<String> splitStringList = chineseSplitFunction(chineseString,"UTF-8",60);        
        for (String split:splitStringList) {        
            System.out.println(split);    
        }    
    }

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值