学习毕向东老师java教程的正则表达式时,有这样的练习题:
将ip地址字符串"192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30"分离出来;
String ip = "192.68.1.254 102.49.23.013 10.10.10.10 2.2.2.2 8.109.90.30";
主要有这样几个步骤,先将数字前补0,
ip = ip.replaceAll("(\\d+)","00$1");
然后每个IP地址上的四个数字都保留3位:
ip = ip.replaceAll("0+(\\d{3})","$1");
然后把字符串放到TreeSet中排序
String[] arr = ip.split(" +");
TreeSet<String> ts = new TreeSet<String>();
for (String s : arr) {
ts.add(s);
}
for (String s : ts) {
System.out.println(s);
}
这时打印的结果是:
002.002.002.002
008.109.090.030
010.010.010.010
102.049.023.013
192.068.001.254
为了去掉前置的0,在打印的语句中添加:
System.out.println(s.replaceAll("0*(\\d+)","$1"));
这样结果就OK了:
2.2.2.2
8.109.90.30
10.10.10.10
102.49.23.13
192.68.1.254
我在做这个练习的时候,把上面的输出写成:
System.out.println(s.replaceAll("0+(\\d+)","$1"));//注意0后面是"+"号
结果输出为:
2.2.2.2
8.19.90.30
10.10.10.10
12.49.23.13
192.68.1.254
乍一看也OK,再仔细一看,不对了,109,102中间的0也没了,变成19,12了,这是怎么回事呢
很明显,问题就应该出在"+"号上面,仔细想了一想,
当判断到109时,如果是0*,那么是满足的(没有0后面跟数字),就把后面的数字(109)保留了下来;
如果是0+的话(首先要明确0+的意思:至少1次0),109的第一个字符1不满足,从下个字符0判断,OK,然后再决断下面是9,再后面不是数字了,
就把9前面的0丢掉了,保留9,效果就是109变成了19. 102类似情况.
回过头来看前面
将每个IP地址上的四个数字都保留3位:的这句代码
ip = ip.replaceAll("0+(\\d{3})","$1");
这里面的0*和0+在这个例子中效果就一样了,有了上面的经验,这个就不难想通了:
0+(\\d{3})表示一个或多个0开头且这串字符至少4个数字,例如:00192满足,保留后3位,替换为192; 002不满足,不替换,还是002
而0*(\\d{3})表示0个或多个0开头且这串字符至少3个数字,例如:00192满足,保留后3位,替换为192; 002满足,保留后3位,还是002
在这里效果上是一样的.
这个细节告诉我,写代码时一定要考虑细致,不然结果就不是想要的了,千万不能有差不多的想法