Java基础--String(按照指定编码截取文字)

/**
 * 字符串按照字节来截取。例如:abc中国
 * 存在的问题:   
 *  1.字符是一个字节,容易截取.但是一个文字是两个字节,应该按照什么方式截取呢? 
 *  2.可以按照文件的编码方式来截取,GBK的编码方式是中文全部是负数(奇数位也有可能是正数).
 *  3.根据编码表来判断即可。
 */
public class StringByteSplitDemo {
    public static void main(String[] args) throws IOException {
        String str = "abc中国国";
        for(int i = 0;i<str.length()+1;i++){
            String s = splitMethod(str,i+1);
            System.out.println("按照长度为"+(i+1)+"截取的字符是:"+s);
        }
    }

    private static String splitMethod(String str, int leng) throws IOException {
        //将字符串用指定的编码表,来进行编码
        byte[] be = str.getBytes("GBK");
        //记录负数的个数
        int count = 0;
        //根据字节编码来判断是否是完整的字符,按照指定的位置来截取
        for(int i=leng-1;i>=0;i--){
            if(be[i]<0){
                count++;
            }else{//都是大于0
                break;
            }
        }
        if(count%2==0){
            //按照指定编码重新解码
            return new String(be,0,leng,"GBK");
        }else{
            return new String(be,0,leng-1,"GBK");
        }
    }
}
运行结果: 
按照长度为1截取的字符是:a 
按照长度为2截取的字符是:ab 
按照长度为3截取的字符是:abc 
按照长度为4截取的字符是:abc 
按照长度为5截取的字符是:abc中 
按照长度为6截取的字符是:abc中 
按照长度为7截取的字符是:abc中国

API参考:

类 String

java.lang.Object
  |--java.lang.String
构造方法摘要
String() 
          初始化一个新创建的 String 对象,使其表示一个空字符序列。
String(byte[] bytes) 
          通过使用平台的默认字符集解码指定的 byte 数组,构造一个新的 String
String(byte[] bytes, Charset charset) 
          通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String
String(byte[] ascii, int hibyte) 
          已过时。 该方法无法将字节正确地转换为字符。从 JDK 1.1 开始,完成该转换的首选方法是使用带有 Charset、字符集名称,或使用平台默认字符集的 String 构造方法。
String(byte[] bytes, int offset, int length) 
          通过使用平台的默认字符集解码指定的 byte 子数组,构造一个新的 String
String(byte[] bytes, int offset, int length, Charset charset) 
          通过使用指定的 charset 解码指定的 byte 子数组,构造一个新的 String
String(byte[] ascii, int hibyte, int offset, int count) 
          已过时。 该方法无法将字节正确地转换为字符。从 JDK 1.1 开始,完成该转换的首选方法是使用带有 Charset、字符集名称,或使用平台默认字符集的 String 构造方法。
String(byte[] bytes, int offset, int length, String charsetName) 
          通过使用指定的字符集解码指定的 byte 子数组,构造一个新的 String
String(byte[] bytes, String charsetName) 
          通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String
String(char[] value) 
          分配一个新的 String,使其表示字符数组参数中当前包含的字符序列。
String(char[] value, int offset, int count) 
          分配一个新的 String,它包含取自字符数组参数一个子数组的字符。
String(int[] codePoints, int offset, int count) 
          分配一个新的 String,它包含 Unicode 代码点数组参数一个子数组的字符。
String(String original) 
          初始化一个新创建的 String 对象,使其表示一个与参数相同的字符序列;换句话说,新创建的字符串是该参数字符串的副本。
String(StringBuffer buffer) 
          分配一个新的字符串,它包含字符串缓冲区参数中当前包含的字符序列。
String(StringBuilder builder) 
          分配一个新的字符串,它包含字符串生成器参数中当前包含的字符序列。
方法摘要
 charcharAt(int index) 
          返回指定索引处的 char 值。
 intcodePointAt(int index) 
          返回指定索引处的字符(Unicode 代码点)。
 intcodePointBefore(int index) 
          返回指定索引之前的字符(Unicode 代码点)。
 intcodePointCount(int beginIndex, int endIndex) 
          返回此 String 的指定文本范围中的 Unicode 代码点数。
 intcompareTo(String anotherString) 
          按字典顺序比较两个字符串。
 intcompareToIgnoreCase(String str) 
          按字典顺序比较两个字符串,不考虑大小写。
 Stringconcat(String str) 
          将指定字符串连接到此字符串的结尾。
 booleancontains(CharSequence s) 
          当且仅当此字符串包含指定的 char 值序列时,返回 true。
 booleancontentEquals(CharSequence cs) 
          将此字符串与指定的 CharSequence 比较。
 booleancontentEquals(StringBuffer sb) 
          将此字符串与指定的 StringBuffer 比较。
static StringcopyValueOf(char[] data) 
          返回指定数组中表示该字符序列的 String。
static StringcopyValueOf(char[] data, int offset, int count) 
          返回指定数组中表示该字符序列的 String。
 booleanendsWith(String suffix) 
          测试此字符串是否以指定的后缀结束。
 booleanequals(Object anObject) 
          将此字符串与指定的对象比较。
 booleanequalsIgnoreCase(String anotherString) 
          将此 String 与另一个 String 比较,不考虑大小写。
static Stringformat(Locale l, String format, Object... args) 
          使用指定的语言环境、格式字符串和参数返回一个格式化字符串。
static Stringformat(String format, Object... args) 
          使用指定的格式字符串和参数返回一个格式化字符串。
 byte[]getBytes() 
          使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。
 byte[]getBytes(Charset charset) 
          使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组。
 voidgetBytes(int srcBegin, int srcEnd, byte[] dst, int dstBegin) 
          已过时。 该方法无法将字符正确转换为字节。从 JDK 1.1 起,完成该转换的首选方法是通过 getBytes() 方法,该方法使用平台的默认字符集。
 byte[]getBytes(String charsetName) 
          使用指定的字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。
 voidgetChars(int srcBegin, int srcEnd, char[] dst, int dstBegin) 
          将字符从此字符串复制到目标字符数组。
 inthashCode() 
          返回此字符串的哈希码。
 intindexOf(int ch) 
          返回指定字符在此字符串中第一次出现处的索引。
 intindexOf(int ch, int fromIndex) 
          返回在此字符串中第一次出现指定字符处的索引,从指定的索引开始搜索。
 intindexOf(String str) 
          返回指定子字符串在此字符串中第一次出现处的索引。
 intindexOf(String str, int fromIndex) 
          返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始。
 Stringintern() 
          返回字符串对象的规范化表示形式。
 booleanisEmpty() 
          当且仅当 length() 为 0 时返回 true
 intlastIndexOf(int ch) 
          返回指定字符在此字符串中最后一次出现处的索引。
 intlastIndexOf(int ch, int fromIndex) 
          返回指定字符在此字符串中最后一次出现处的索引,从指定的索引处开始进行反向搜索。
 intlastIndexOf(String str) 
          返回指定子字符串在此字符串中最右边出现处的索引。
 intlastIndexOf(String str, int fromIndex) 
          返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索。
 intlength() 
          返回此字符串的长度。
 booleanmatches(String regex) 
          告知此字符串是否匹配给定的正则表达式
 intoffsetByCodePoints(int index, int codePointOffset) 
          返回此 String 中从给定的 index 处偏移 codePointOffset 个代码点的索引。
 booleanregionMatches(boolean ignoreCase, int toffset, String other, int ooffset, int len) 
          测试两个字符串区域是否相等。
 booleanregionMatches(int toffset, String other, int ooffset, int len) 
          测试两个字符串区域是否相等。
 Stringreplace(char oldChar, char newChar) 
          返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
 Stringreplace(CharSequence target, CharSequence replacement) 
          使用指定的字面值替换序列替换此字符串所有匹配字面值目标序列的子字符串。
 StringreplaceAll(String regex, String replacement) 
          使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
 StringreplaceFirst(String regex, String replacement) 
          使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。
 String[]split(String regex) 
          根据给定正则表达式的匹配拆分此字符串。
 String[]split(String regex, int limit) 
          根据匹配给定的正则表达式来拆分此字符串。
 booleanstartsWith(String prefix) 
          测试此字符串是否以指定的前缀开始。
 booleanstartsWith(String prefix, int toffset) 
          测试此字符串从指定索引开始的子字符串是否以指定前缀开始。
 CharSequencesubSequence(int beginIndex, int endIndex) 
          返回一个新的字符序列,它是此序列的一个子序列。
 Stringsubstring(int beginIndex) 
          返回一个新的字符串,它是此字符串的一个子字符串。
 Stringsubstring(int beginIndex, int endIndex) 
          返回一个新字符串,它是此字符串的一个子字符串。
 char[]toCharArray() 
          将此字符串转换为一个新的字符数组。
 StringtoLowerCase() 
          使用默认语言环境的规则将此 String 中的所有字符都转换为小写。
 StringtoLowerCase(Locale locale) 
          使用给定 Locale 的规则将此 String 中的所有字符都转换为小写。
 StringtoString() 
          返回此对象本身(它已经是一个字符串!)。
 StringtoUpperCase() 
          使用默认语言环境的规则将此 String 中的所有字符都转换为大写。
 StringtoUpperCase(Locale locale) 
          使用给定 Locale 的规则将此 String 中的所有字符都转换为大写。
 Stringtrim() 
          返回字符串的副本,忽略前导空白和尾部空白。
static StringvalueOf(boolean b) 
          返回 boolean 参数的字符串表示形式。
static StringvalueOf(char c) 
          返回 char 参数的字符串表示形式。
static StringvalueOf(char[] data) 
          返回 char 数组参数的字符串表示形式。
static StringvalueOf(char[] data, int offset, int count) 
          返回 char 数组参数的特定子数组的字符串表示形式。
static StringvalueOf(double d) 
          返回 double 参数的字符串表示形式。
static StringvalueOf(float f) 
          返回 float 参数的字符串表示形式。
static StringvalueOf(int i) 
          返回 int 参数的字符串表示形式。
static StringvalueOf(long l) 
          返回 long 参数的字符串表示形式。
static StringvalueOf(Object obj) 
          返回 Object 参数的字符串表示形式。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值