目录
StringUtils.split()和string.split()的区别
1、public string[] split(string regex);
2、public String[] split(String regex,int limit);
场景
出于业务考虑,将多个字符串拼接起来时,使用的分隔符是 ;,;
。如果要将这样一个拼接来的字符串分割成原本的多个字符串时,就需要使用到jdk自带的split()方法。不过因为公司的编程规范,改为使用了Apache工具类的StringUtils.split()。
之后就发现,当被拼接的字符串里含有 ;
或 ,
时,就会出现分割不正确的问题。
具体例子
下面的代码,使用了上述的两种split方法,猜猜结果是什么。
public class Test {
public static void main(final String[] args) {
final String str = "老肥,老肥;是个,逗比";
final String seperator = ";,;";
//Apache工具类的split方法
final String[] result1 = StringUtils.split(str, seperator);
for (final String string : result1) {
System.out.println(string);
}
System.out.println("############分割线###########");
//jdk的split方法
final String[] result2 = str.split(seperator);
for (final String string : result2) {
System.out.println(string);
}
}
}
分割的结果如下:
老肥
老肥
是个
逗比
############分割线###########
老肥,老肥;是个,逗比
StringUtils.split()和string.split()的区别
StringUtils.split()
是把分隔符拆成一个个单独的字符,再用这些字符去把字符串进行分割的。只要匹配到了分隔符中的任意一个字符,就会进行分割。
string.split()
是把分隔符作为一个整体来对字符串进行分割。
比如分隔符是
;,;
,那么在用StringUtils.split()
时,只要被分割的字符串里遇到;
或,
,就会被分割。在用
string.split()
时,必须被分割的字符串里遇到;,;
时才会被分割。
另外
string.split()
的分隔符参数其实是正则表达式,而StringUtils.split()
的分隔符参数就只是个普通的字符串。
此外,
StringUtils.split()
是null-safe的,已经帮你判空了,这也是公司规范要我们使用Apache工具类的原因。不过由于这里的业务要求,最终还是选择使用string.split()
。
最后附上StringUtils.split()
的部分底层实现:
//standard case
while (i < len) {
if (separatorChars.indexOf(str.charAt(i)) >= 0) {
if (match || preserveAllTokens) {
lastMatch = true;
if (sizePlus1++ == max) {
i = len;
lastMatch = false;
}
list.add(str.substring(start, i));
match = false;
}
start = ++i;
continue;
}
lastMatch = false;
match = true;
i++;
}
string.split()的用法
String有两个split()方法
1、public string[] split(string regex);
这里的参数的名称是 regex ,也就是 regular expression (正则表达式)。这个参数并不是一个简单的分割用的字符,而是一个正则表达式,对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:
(1) 用竖线 | 分隔字符串,你将得不到预期的结果
String[] aa = "aaa|bbb|ccc".split("|");
String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的
注意:“.”和“|”、“*”、“+”等都是转义字符,作为分隔的话,必须得加"\\";
String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");
String.split("\\*"),这样才能正确的分隔开,不能用String.split("*");
String.split("\\+"),这样才能正确的分隔开,不能用String.split("+");
(2)还有如果想在串中使用"\"字符,则也需要转义,首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果:
String[] aa = "aaa\\bbb\\bccc".split(\\\\);
(3)如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用String.split("and|or");
案例一:
string s="abcdeabcdeabcde";
string[] sArray=s.Split('c') ;
for (String a : sArray) { System.out.println(a);}
结果:
ab
deab
deab
de
案例二:
使用另一种构造方法(数组)对多个字符进行分割:
string s="abcdeabcdeabcde";
string[] sArray1=s.Split(new char[3]{'c','d','e'}) ;
for(string i : sArray1) {System.out.println(i)};
结果:
ab
ab
ab
2、public String[] split(String regex,int limit);
根据匹配给定的正则表达式和limit 参数控制分割次数来拆分此字符串。
limit 参数通过控制分割次数从而影响分割结果
如果传入 n(n>0) 那么字符串最多被分割 n-1 次,分割得到数组长度最大是 n
如果 n = -1 将会以最大分割次数分割
如果 n = 0 将会以最大分割次数分割,但是分割结果会舍弃末位的空串
"@2@3@".split("@",-1); //[ , 2, 3, ]
"@2@3@".split("@",0); //[ , 2, 3]
"@2@3@".split("@",2); //[ , 2@3@]
"@2@3@".split("@",3); //[ , 2, 3@]
"@2@3@".split("@",4); //[ , 2, 3, ]
"@2@3@".split("@",5); //[ , 2, 3, ]