使用索引访问用 String 的 split 方法得到的数组时,需做最后一个分隔符后有无内容的检查
一、问题来源自阿里开发手册
出现此问题肯定与String的split方法有关,首先介绍下String的split方法的使用
二、正则表达式用法
单正则表达式构造方法
public String[] split(String regex) {
return split(regex, 0);
}
该方法就是给定的表达式和限制参数0来调用两参数split方法。双参重载构造方法
public String[] split(String regex, int limit) {
/* fastpath if the regex is a
(1)one-char String and this character is not one of the
RegEx's meta characters ".$|()[{^?*+\\", or
(2)two-char String and the first char is the backslash and
the second is not the ascii digit or ascii letter.
*/
char ch = 0;
if (((regex.value.length == 1 &&
".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
(regex.length() == 2 &&
regex.charAt(0) == '\\' &&
(((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
((ch-'a')|('z'-ch)) < 0 &&
((ch-'A')|('Z'-ch)) < 0)) &&
(ch < Character.MIN_HIGH_SURROGATE ||
ch > Character.MAX_LOW_SURROGATE))
{
int off = 0;
int next = 0;
boolean limited = limit > 0;
ArrayList<String> list = new ArrayList<>();
while ((next = indexOf(ch, off)) != -1) {
if (!limited || list.size() < limit - 1) {
list.add(substring(off, next));
off = next + 1;
} else { // last one
//assert (list.size() == limit - 1);
list.add(substring(off, value.length));
off = value.length;
break;
}
}
// If no match was found, return this
if (off == 0)
return new String[]{this};
// Add remaining segment
if (!limited || list.size() < limit)
list.add(substring(off, value.length));
// Construct result
int resultSize = list.size();
if (limit == 0) {
while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
resultSize--;
}
}
String[] result = new String[resultSize];
return list.subList(0, resultSize).toArray(result);
}
return Pattern.compile(regex).split(this, limit);
}
参数regex:
1.如果表达式不匹配输入的任何内容,返回的数组只具有一个元素,即此字符串。(对于空字符串需特别注意,一个字符串)
2.可以匹配的情况下,每一个字符串都由另一个匹配给定表达式的子字符串终止,或者由此字符串末尾终止(数组中的字符串按照他们在此字符串出现的顺序排列)
参数:limit:
该参数用于控制模式匹配使用的次数,可以影响到数组的长度
1.limit>0:
模式匹配将被最多应用n-1次,数组的长度将不会大于n,数组的最后一项将包含所有超出最后匹配的定界符的输入。
String str="a?b?c?d?f?gh???";
String []arr=str.split("\\?",5);//截取5-1=4次
System.out.println("数据的长度"+arr.length+" 数组的内容"+Arrays.toString(arr));
//打印结果:数据的长度5 数组的内容[a, b, c, d, f?gh???]
2.limit<0:
模式匹配将应用尽可能多的次数,而且数组的长度是任何长度。
String str="a?b?c?d?f?gh???";
String []arr=str.split("\\?",-1);//每一次都分割,且忽略最后是否切割的为空值
System.out.println("数据的长度"+arr.length+" 数组的内容"+Arrays.toString(arr));
//打印结果:数据的长度9 数组的内容[a, b, c, d, f, gh, , , ]
3.limit=0:
模式匹配将被应用尽可能多的次数,数组可以是任何长度,并且结尾空字符串将被丢弃。
String str="a?b?c?d?f?gh???";
String []arr=str.split("\\?",0);//每一次都分割,且忽略最后是否切割的为空值
System.out.println("数据的长度"+arr.length+" 数组的内容"+Arrays.toString(arr));
//打印结果:数据的长度6 数组的内容[a, b, c, d, f, gh]
三、问题分析
对于开头我们引入的问题,先进行测试
String str="a,b,c,,";
String []arr=str.split(",");
System.out.println("数据的长度"+arr.length+" 数组的内容"+Arrays.toString(arr));
//打印结果:数据的长度3 数组的内容[a, b, c]
1.忽略结尾空字符实际问题无线在调用了单个参数构造方法,而单个参数构造方法调用的是split(regex, 0),所以才会出现忽略结尾空字符串的情况。
2.如果不想忽略结尾空字符我们只需要将自行调用双参构造方法,第二个参数我们将其申明为负数即可。