分析java中String.split的源码并说一下常犯的错误

腾讯笔试,第一个题15分钟写完,20分钟修改,唉,够够的,我都在想这是不是出题的人专门设置的,就看你看过String.split的源码不,不多说了,分析一下

直接上源码:

  public String[] split(String regex) {
        return split(regex, 0);
    }
 public String[] split(String regex, int limit) {
        /* fastpath if the regex is a
         (1)one-char String and this character is not one of the
            RegEx's meta characters ".$|()[{^?*+\\", or
         (2)two-char String and the first char is the backslash and
            the second is not the ascii digit or ascii letter.
         */
        char ch = 0;
        if (((regex.value.length == 1 &&
             ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
             (regex.length() == 2 &&
              regex.charAt(0) == '\\' &&
              (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
              ((ch-'a')|('z'-ch)) < 0 &&
              ((ch-'A')|('Z'-ch)) < 0)) &&
            (ch < Character.MIN_HIGH_SURROGATE ||
             ch > Character.MAX_LOW_SURROGATE))
        {
            int off = 0;
            int next = 0;
            boolean limited = limit > 0;
            ArrayList<String> list = new ArrayList<>();
            while ((next = indexOf(ch, off)) != -1) {
                if (!limited || list.size() < limit - 1) {
                    list.add(substring(off, next));
                    off = next + 1;
                } else {    // last one
                    //assert (list.size() == limit - 1);
                    list.add(substring(off, value.length));
                    off = value.length;
                    break;
                }
            }
            // If no match was found, return this
            if (off == 0)
                return new String[]{this};

            // Add remaining segment
            if (!limited || list.size() < limit)
                list.add(substring(off, value.length));

            // Construct result
            int resultSize = list.size();
            if (limit == 0) {
                while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
                    resultSize--;
                }
            }
            String[] result = new String[resultSize];
            return list.subList(0, resultSize).toArray(result);
        }
        return Pattern.compile(regex).split(this, limit);
    }

看上面看的眼花缭乱?其实没那么复杂,split 的底层就是用一个ArrayListsubstring来实现的,ArrayList负责存储分隔开的数组,而substring负责把String切割成一个一个的数组

重要的不是if判断为true的执行流程,而是判断语句

  if (((regex.value.length == 1 &&
             ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
             (regex.length() == 2 &&
              regex.charAt(0) == '\\' &&
              (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
              ((ch-'a')|('z'-ch)) < 0 &&
              ((ch-'A')|('Z'-ch)) < 0)) &&
            (ch < Character.MIN_HIGH_SURROGATE ||
             ch > Character.MAX_LOW_SURROGATE))

上面有解释,翻译一下:
regex需要满足的条件,这两个满足一个就行

(1)一个字符字符串,而此字符不是regex的元字符“. $ |()[^”?*+\\“,或
(2)两个字符字符串,第一个字符是反斜杠,并且第二个不是ASCII数字或ASCII字母

再来说说我的情况,正好能形成一个反例

String a="2|CA";

根据 | 拆成2和CA两个字符串数组
如果String []b=a.split("|");它会拆成4个数组

2  
|  
C  
A  

肯定和我们的想法相违背,所以只能自己用substring截了
当然你会说不满足第第一个情况你可以加反斜杠变成第二种情况啊,那你就想错了,肯定会报错,反斜杆是给/n /r /f //等等准备的,

还有一点注意的,如果是第一种情况的那些字符,如果你真按那些分割的话,返回的结果是不一样的
例子

String a="2$CA";		
		String []b=a.split("$");
		for(int i =0;i<b.length;i++) {
			System.out.println(b[i]+"  ");
		}

结果:
在这里插入图片描述
另一种就是上面的 | ,所以可能是不一样的,所以要看清啊!!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值