今天工作中需要从一段String中解析一个密码信息,密码可能有6位、8位,而且可以为数字或者大小写英文字母。
可能很容易想到的做法是利用string的length循环判断每一位string的Unicode编码,数字、英文大小写字母的编码取值范围是确定的,然后取出在此编码范围的连续6到8位的字串即可。
但突然想到强大的正则表达式,这个小需求正是它的用武之地,用它可以很轻松的匹配出符合某种语法规则的字串来。
例如我们还可以判断某些输入是否是标准的用户名格式,用户名规则可能是大小写字母、数字、下划线等等,还有是否是标准的email,太多了。
好吧,言归正传,给出简单的示例。
代码如下:
public static void main(String[] args)throws Exception{
parseTest("456bcdBCD哈哈123abcABC嘿嘿nishijianren123");
}
private static void parseTest(String src) {
// 正则表达式,匹配由数字和26个英文大小写字母组成的字符串,需要连续大于6位以上
String filter = "[A-Za-z0-9]{6,6}";
// System.out.println(filter);
Pattern exp = Pattern.compile(filter);
Matcher matcher = exp.matcher(src);
// System.out.println(matcher.toString());
while(matcher.find()){
System.out.println("here");
System.out.println(matcher.group());
}
}
输出:
here
456bcdBCD
here
123abcABC
here
nishijianren123
看着是不是很简单很强大,你只需要一个定义好的规则,就能给你所有你想要的结果。[A-Za-z0-9]{6,8}后面的{6,8}代表需要匹配6到8位,{6,}代表6位以上,也可以这么写[0-9]{6,6}代表只匹配6位数字。
是不是心动了,赶紧让你的编译器工作吧!
今天又有新的需求了,例如:你的老密码为:123456789,你开通的新密码为:789654,请保存。假如这是一个短信的body,从中解析出连续6位数字的新密码,利用正则表达式。
此正则的写法为:(?<![0-9])[0-9]{6}(?![0-9]) 等价于 (?<!\\d)\\d{6}(?!\\d) ,[0-9]和\d均代表数字。
(?<![0-9])代表此连续的6位数字前不能有数字,这个正则的规则称为:零宽度负回顾后发断言(?<!exp)-断言此位置的前面不能匹配表达式exp
(?![0-9]) 代表连续的6位数字后面不能有数字,这个正则规则称为:零宽度负预测先行断言(?!exp)-断言此位置的后面不能匹配表达式exp。
demo如下:
public static void main(String[] args)throws Exception{
parseTest("您已重置WLAN密码,新密码为:676112679999,请注意保管;新密码为:123789");
parseTest("423456");
parseTest("1423456");
}
private static void parseTest(String src) {
// 正则表达式,匹配由数字和26个英文大小写字母组成的字符串,需要连续大于6位以上
String filter = "(?<![0-9])[0-9]{6}(?![0-9])";
Pattern exp = Pattern.compile(filter);
Matcher matcher = exp.matcher(src);
while(matcher.find()){
System.out.println("here");
System.out.println(matcher.group());
}
}
结果正好和需求吻合,正则表达式的功能确实很强大,可以实现很多匹配、查找和替换字符串的需求,采用此正则还是很方便的,但是需要浪费一些正则解释执行的时间。