split()的坑

 
Java中的我们可以利用split把字符串按照指定的分割符进行分割,然后返回字符串数组
   split 方法
      该方法的作用是:将一个字符串分割为子字符串,然后将结果作为字符串数组返回。
      stringObj.split([separator,[limit]]) 
         stringObj
             必选项。要被分解的 String 对象或文字,该对象不会被split方法修改。
       separator 
            可选项。字符串或正则表达式对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。 
       limit
            参数控制模式应用的次数,因此影响所得数组的长度。如果该限制 n 大于 0,则模式将被最多应用 n - 1 次,数组的长度将不会大于 n,而且数组的最后一项将包含所有超出最后匹配的定界符的输入。如果 n 为非正,那么模式将被应用尽可能多的次数,而且数组可以是任何长度。如果 n 为 0,那么模式将被应用尽可能多的次数,数组可以是任何长度,并且结尾空字符串将被丢弃。

    遇到的问题是:
      
[java]  view plain  copy
  1. public class Split {  
  2.     public static void main(String args[]){  
  3.         String s = "1__________";  
  4.         String[] arraystr = s.split("_");  
  5.         for(int i=0;i<arraystr.length;i++){  
  6.             System.out.println("lulu ="+arraystr[i]);  
  7.         }     
  8.     }  
  9. }  
结果是:
    lulu =1
只能解析出第一个元素1,其他的都不能解析但是这样就都能解析出来了



[java]  view plain  copy
  1. public class Split {  
  2.     public static void main(String args[]){  
  3.         String s = "1__________9";  
  4.         String[] arraystr = s.split("_");  
  5.         for(int i=0;i<arraystr.length;i++){  
  6.             System.out.println("lulu ="+arraystr[i]);  
  7.         }     
  8.     }  
  9. }  
结果是:
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =9
    但是在实际开发的时候不能保证最后一个分隔符被分的字符串为不空,所以在用split()这个方法后再取被分隔的字符串数组的时候有时候就出现数据越界的问题(最后一个分隔符被分的字符串为空)

   想到了一个方法是 split([separator,[limit]]) ,后面把limit赋值成比该字符串被分隔成字符数组后数组的长度大很多的值,这能保证所有为空的都能被解析,这正应了api里的解释:如果该限制 n 大于 0,则模式将被最多应用 n - 1 次(此时n为15)
[java]  view plain  copy
  1. public class Split {  
  2.     public static void main(String args[]){  
  3.         String s = "1__________";  
  4.         String[] arraystr = s.split("_",15);  
  5.         for(int i=0;i<arraystr.length;i++){  
  6.             System.out.println("lulu ="+arraystr[i]);  
  7.         }     
  8.     }  
  9. }  
结果是:
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =


如果该限制 n 大于 0,则模式将被最多应用 n - 1 次(此时n为5)
[java]  view plain  copy
  1. public class Split {  
  2.     public static void main(String args[]){  
  3.         String s = "1__________";  
  4.         String[] arraystr = s.split("_",5);  
  5.         for(int i=0;i<arraystr.length;i++){  
  6.             System.out.println("lulu ="+arraystr[i]);  
  7.         }     
  8.     }  
  9. }  
结果是:
lulu =1
lulu =
lulu =
lulu =
lulu =______


如果把limit设置为非正,也能全部解析如:
[java]  view plain  copy
  1. public class Split {  
  2.     public static void main(String args[]){  
  3.         String s = "1__________";  
  4.         String[] arraystr = s.split("_",-1);  
  5.         for(int i=0;i<arraystr.length;i++){  
  6.             System.out.println("lulu ="+arraystr[i]);  
  7.         }     
  8.     }  
  9. }  
结果是:
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =



1.当参数为整数的时候,只需要截取前几个,需要几个截取几个,这个不用多说。 

Java代码 
  1. String line =  "aa,bb,cc,dd,,,," ;  
  2. System.out.println(line.split( "," , 6 ).length);  
  3. 输出结果为 6 ,limit参数指定几个,输出几个,最多为 8 个  
        2.当参数为零的时候,和split()一样,截图尽可能多的字符串(其实不是最多的)。 
Java代码  
  1. String line =  "aa,bb,cc,dd,,,," ;  
  2. System.out.println(line.split( "," , 0 ).length);  
  3. 输出结果为 4   
        3.当参数为负的时候,即使后面有空的串,也会输出到最大 
Java代码  
  1. String line =  "aa,bb,cc,dd,,,," ;  
  2. System.out.println(line.split( "," ,- 1 ).length);  
  3. 输出结果为 8   

注意:
1、如果用“.”作为分隔的话,必须是如下写法,String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
2、如果用“|”作为分隔的话,必须是如下写法,String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");

原因解析:

点进去看源码,debug一下,如下图:


可以看到,刚刚开始的时候,确实是有0-7,8个分割出来的东西存在,有三个是空字符串,""。不是null。不用担心空指针异常。

然后 看到下面的继续走,if语句,就看到,他把这个list从尾部开始判断,如果这个list的后面的字符串的长度是0,那么这个resultSize就 减减,然后一直while循环,

直到不符合条件,那么list的下标是5、6、7的值就被抛弃了,然后新生的结果字符串数组,的大小就变成加工过后的长度,那么就变成了长度 5的数组。

list.subList(0, resultSize).toArray(result)

就是这句话啦。


他只是处理后面尾部的空字符串,不处理中间的空字符串和 开头的空字符串。

现在要求字符串

"aa12sas32sasa223sas12as12wqe"//去掉数字,然后弄成数组
"aa,,sas,,sasa,,,,sasas,,,"//去掉逗号,不管几个逗号,都去掉
"aa  sas sa sa     sas  as  "//去掉空格,也不管几个,
把他们给分解成数组,同时刨除掉不用的多余信息。

具体实现代码如下:

[java]  view plain  copy
  1. private static void testSplitPlus() {  
  2.     String ss = "aa12sas32sasa223sas12as12wqe";  
  3.     String[] array = ss.split("[\\d]+");  
  4.     System.out.println(Arrays.toString(array));  
  5.     ss = "aa,,sas,,sasa,,,,sasas,,,";  
  6.     array = ss.split("[,]+");  
  7.     System.out.println(Arrays.toString(array));  
  8.     ss = "aa  sas sa sa     sas  as  ";  
  9.     array = ss.split("[\\s]+");  
  10.     System.out.println(Arrays.toString(array));  
  11. }  
下面再看看这个split的源码。

[java]  view plain  copy
  1. public String[] split(String regex) {  
  2.     return split(regex, 0);  
  3. }  
不知道你看到没,那个regex,不就是正则表达式的意思嘛?

那就明白了,这个方法是支持正则表达式操作的。那上面的代码就好解释啦。

第一个[\\d]+这个解释就是\\是转义符,d表示数字,括起来后面的加号表示一个或者多个,那么就可以解释运行结果啦。

第二个[,]解释类似,就是逗号出现一次或多次,

第三个,\\s,就是匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

然后下面,看运行结果。



  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值