本章科普正则表达式(regular expression),欢迎各位同学转载,但转载务必注明出处,否则盘你~
概念
正则表达式(regular expression)是指一个用来描述或者匹配一系列符合某个句法规则的单个字符串,其实就是一种规则,表现形式是字符串。比如你挑对象时列了一堆标准,要有房有车有存款,独生子女,巴拉巴拉~这些个标准就可以看成是一个正则表达式。
引入正则
我们先来看一个需求,
校验QQ号码 要求:
1.必须是5~15位纯数字
2.不能以0开头
package regex;
import java.util.Scanner;
/**
* 校验QQ号码 要求:1.必须是5~15位纯数字 2.不能以0开头
*
* @author Ke_Xiaomiao
*
*/
public class RegexDemo {
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
System.out.println("请输入您的QQ号码:");
String str = sc.nextLine();
boolean isQQ = checkQQ(str);
boolean isQQ2 = checkQQByRegex(str);
System.out.println("isQQ == " + isQQ);
System.out.println("isQQ2 == " + isQQ2);
}
public static boolean checkQQ(String str) {
boolean isQQ = true;
if (str != null && str.length() >= 5 && str.length() <= 15) {
if (!str.startsWith("0")) {
char[] chs = str.toCharArray();
for (int i = 0; i < chs.length; i++) {
if (!Character.isDigit(chs[i])) {
isQQ = false;
break;
}
}
} else {
isQQ = false;
}
} else {
isQQ = false;
}
return isQQ;
}
/**
* 用正则改进
* @param str 输入的QQ号码
* @return
*/
public static boolean checkQQByRegex(String str) {
return str == null ? false : str.matches("[1-9]\\d{1,14}");
}
}
这里我分别通过普通方法和正则实现校验QQ,很明显正则要简单很多,一行代码搞定,看到这里,是不是发现正则还是很强大的!
常见的规则
规则定义在java.util.regex.Pattern类中,常见的有如下几种:
- 字符
x 字符 x。举例:'a'表示字符a
\\ 反斜线字符。即“\\”表示"\","\\\\"表示“\\”
\n 新行(换行)符 ('\u000A')
\r 回车符 ('\u000D')
- 字符类
[abc] a或b或c
[^abc] 除了a或b或c之外的任何字符
[a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内,即所有英文字母
[0-9] 0到9的字符都包括
- 预定义字符类
. 任何字符。"."字符本身,怎么表示呢?" \\."
\d 数字:[0-9]
\w 单词字符:[a-zA-Z_0-9],在正则表达式里面组成单词的东西必须有这些东西组成,包含所有英文字母大小写、下划线“_”、数字
- 边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
就是不是单词字符的地方,注意是地方,不是指的哪个字符,这个稍微有点难理解,我们还是看看代码示例
public static void main(String[] args) {
String str = "helloworld?";
String result1 = str.replaceAll("\\b", "*");
String result2 = str.replaceAll("\\B", "*");
System.out.println("result1 == " + result1);
System.out.println("result2 == " + result2);
}
运行结果:
result1 == *helloworld*?
result2 == h*e*l*l*o*w*o*r*l*d?*
可能初学者会认为“helloworld?”中的“?”就是单词边界,其实不是的
- Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
正则表达式的常用功能
-
分割功能
package regex;
import java.util.Scanner;
/**
* 题目描述 计算字符串最后一个单词的长度,单词以空格隔开。
*
* 输入描述:一行字符串,非空,长度小于5000。 输出描述:整数N,最后一个单词的长度。 示例:输入:hello world 输出:5
*
* @author Ke_Xiaomiao
*
*/
public class RegexSplitDemo {
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
while (sc.hasNextLine()) {
String str = sc.nextLine();
String[] strs = str.split(" +");
int lastLetterLength = strs[strs.length - 1].length();
System.out.println(lastLetterLength);
}
}
}
未完待续。。。