Java中trim()的坑
**trim(): ** 去除左右两边ascall码小于等于32的字符。
前言:一直以来我都以为java中的trim()方法只是用来去除字符串左右两边的空格,直到前不久的一次bug暴露,才知道trim()方法不仅仅去除了空格,底层原理是对左右两边ascall小于等于32的都进行了去除(如果ascall小于等于32的字符在字符串中间则不去除中间的部分)
先看个示例:
String a="aaa\n ";
System.out.println(a.trim()+"测试");
执行结果:
aaa测试
理论上来说应该输出:
aaa
测试
理论上应该是上述的输出结果, \n被转义成换行符,所以aaa与测试会换行输出。结果输出的却是aaa测试
ascall码对照表:
http://c.biancheng.net/c/ascii/
trim()的源码
public String trim() {
int len = value.length;
int st = 0;
char[] val = value; /* avoid getfield opcode */
//左边的ascall码一直小于等于32的话,就一直往右找,直到找到第一个大于32的下标
while ((st < len) && (val[st] <= ' ')) {
st++;
}
//右边的ascall码一直小于等于32的话,就一直往左查找,直到找到第一个大于32的下标
while ((st < len) && (val[len - 1] <= ' ')) {
len--;
}
//截取从左边ascall大于32的下标st一直到从右边ascall大于32的下标len
return ((st > 0) || (len < value.length)) ? substring(st, len) : this;
}
再来看一个有意思的案例:
String str1 = "aaa ";
String str2 = "aaa";
String str3 = "aaa";
str1 = str1.trim();
System.out.println(str1 == str2); // false
System.out.println(str3 == str2); // true
分析:为什么str1 trim后不是==str2呢?
public String substring(int beginIndex, int endIndex) {
if (beginIndex < 0) {
throw new StringIndexOutOfBoundsException(beginIndex);
}
if (endIndex > value.length) {
throw new StringIndexOutOfBoundsException(endIndex);
}
int subLen = endIndex - beginIndex;
if (subLen < 0) {
throw new StringIndexOutOfBoundsException(subLen);
}
return ((beginIndex == 0) && (endIndex == value.length)) ? this
: new String(value, beginIndex, subLen);
}
我们可以看到,调用trim()方法,最后又调用了substring方法,并new String
了一个对象,所以这里的str1不会等于常量str2
java输入ascall码,获取到ascall字符
在ascall码中NUL(null)空字符的16进制为 00,所以在java中可以使用(char)’\u0000’ 代替NUL , 前面\u00开头,后面跟上字符对应的ascall码的16进制数。
再看一个示例:
String b="bbb"+String.valueOf((char)'\u0000');
System.out.println(b+"测试"); //bbb 测试
System.out.println(b.trim()+"测试"); //bbb测试
可以看出,当调用trim后会把左右两边的ascall码值小于等于32的都截取掉