package com.ncss.test.yfJunit;
import java.util.ArrayList;
import java.util.List;
public class BN {
//s表示要截取的字符串 length要截取的字符串的长度 list
public static void bSubstring(String s, int length, List<String> list) throws Exception{
byte[] bytes = s.getBytes("Unicode");
int n = 0; // 表示当前的字节数
int i = 2; // 要截取的字节数,从第3个字节开始
for (; i < bytes.length && n < length; i++){
// 奇数位置,如3、5、7等,为UCS2编码中两个字节的第二个字节
if (i % 2 == 1){
n++; // 在UCS2第二个字节时n加1
}else{
// 当UCS2编码的第一个字节不等于0时,该UCS2字符为汉字,一个汉字算两个字节
if (bytes[i] != 0){
n++;
}
}
}
// 如果i为奇数时,处理成偶数
if (i % 2 == 1){
// 该UCS2字符是汉字时,去掉这个截一半的汉字
if (bytes[i - 1] != 0){
i = i - 1;
}else{// 该UCS2字符是字母或数字,则保留该字符
i = i + 1;
}
}
String str=new String(bytes, 0, i, "Unicode");
list.add(str);
if(str!=null && str.length()>0 && ! s.endsWith(str)){
str=new String(bytes, 0, bytes.length, "Unicode").substring(str.length(),s.length());
bSubstring(str,2,list);
}
// return new String(bytes, 0, i, "Unicode");
}
public static void main(String[] args) {
try {
// System.out.println(BN.bSubstring("我abc汉def字gh",2));
List<String> list=new ArrayList<String>();
BN.bSubstring("我abc汉def字gh2",2,list);
for(String st:list){
System.out.println(st+" ==");
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}