正则表达式

最新推荐文章于 2022-02-20 22:22:58 发布

codedot

最新推荐文章于 2022-02-20 22:22:58 发布

阅读量263

点赞数

分类专栏： Java基础

本文链接：https://blog.csdn.net/m0_53474063/article/details/111604971

版权

Java基础专栏收录该内容

33 篇文章 3 订阅

订阅专栏

本文详细介绍了Java中正则表达式的使用，包括Pattern和Matcher类的核心功能，如校验、查找和替换文本。讲解了正则表达式的基本元字符、等价字符、分组和定位符等概念，并提供了丰富的实例，如校验中文、身份证号、时间、日期、手机号码和IP地址等。同时，还讨论了正则表达式在匹配字符串时的优先级和特殊字符处理。

摘要由CSDN通过智能技术生成

正则表达式(Regular Expression)是一种文本规则，可以用来校验、查找、替换与规则匹配的文本。

一、Java对正则表达式的支持

JDK中的java.util.regex包提供了对正则表达式的支持。

java.util.regex包有三个核心类：

Pattern类：Pattern是一个正则表达式的编译表示。
Matcher类：Matcher是对输入字符串进行解释和匹配操作的引擎。
PatternSyntaxException：PatternSyntaxException是一个非强制异常类，它表示一个正则表达式模式中的语法错误。

注：需要格外注意一点，在Java中使用反斜杠"\"时必须写成 "\\"。所以本文的代码出现形如String regex = "\\$\\{.*?\\}" 其实就是"$\{.*?\}"，不要以为是画风不对哦。

Pattern类

Pattern类没有公共构造方法。要创建一个Pattern对象，你必须首先调用其静态方法compile，加载正则规则字符串，然后返回一个Pattern对象。

与Pattern类一样，Matcher类也没有公共构造方法。你需要调用Pattern对象的matcher方法来获得一个Matcher对象。

示例：

Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(content);

Matcher类

Matcher类可以说是java.util.regex核心类中的必杀技！

Matcher类有三板斧（三类功能）：

校验
查找
替换

校验文本是否与正则规则匹配

为了检查文本是否与正则规则匹配，Matcher提供了以下几个返回值为boolean的方法。

方法及说明
public boolean lookingAt() 尝试将从区域开头开始的输入序列与该模式匹配。
public boolean find() 尝试查找与该模式匹配的输入序列的下一个子序列。
public boolean find(int start）重置此匹配器，然后尝试查找匹配该模式、从指定索引开始的输入序列的下一个子序列。
public boolean matches() 尝试将整个区域与模式匹配。

如果你傻傻分不清上面的查找方法有什么区别，那么下面一个例子就可以让你秒懂。

public static void main(String[] args) {
    checkLookingAt("hello", "helloworld");
    checkLookingAt("world", "helloworld");

    checkFind("hello", "helloworld");
    checkFind("world", "helloworld");

    checkMatches("hello", "helloworld");
    checkMatches("world", "helloworld");
    checkMatches("helloworld", "helloworld");
}

private static void checkLookingAt(String regex, String content) {
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    if (m.lookingAt()) {
        System.out.println(content + "\tlookingAt： " + regex);
    } else {
        System.out.println(content + "\tnot lookingAt： " + regex);
    }
}

private static void checkFind(String regex, String content) {
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    if (m.find()) {
        System.out.println(content + "\tfind： " + regex);
    } else {
        System.out.println(content + "\tnot find： " + regex);
    }
}

private static void checkMatches(String regex, String content) {
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    if (m.matches()) {
        System.out.println(content + "\tmatches： " + regex);
    } else {
        System.out.println(content + "\tnot matches： " + regex);
    }
}

输出：

helloworld    lookingAt： hello
helloworld    not lookingAt： world
helloworld    find： hello
helloworld    find： world
helloworld    not matches： hello
helloworld    not matches： world
helloworld    matches： helloworld

说明：

regex = “world” 表示的正则规则是以world开头的字符串，regex = “hello” 和regex = “helloworld” 也是同理。

lookingAt方法从头部开始，检查content字符串是否有子字符串于正则规则匹配。
find方法检查content字符串是否有子字符串于正则规则匹配，不管字符串所在位置。
matches方法检查content字符串整体是否与正则规则匹配。

查找匹配正则规则的文本位置

为了查找文本匹配正则规则的位置，Matcher提供了以下方法：

方法及说明
public int start() 返回以前匹配的初始索引。
public int start(int group) 返回在以前的匹配操作期间，由给定组所捕获的子序列的初始索引
public int end()返回最后匹配字符之后的偏移量。
public int end(int group)返回在以前的匹配操作期间，由给定组所捕获子序列的最后字符之后的偏移量。
public String group()返回前一个符合匹配条件的子序列。
public String group(int group)返回指定的符合匹配条件的子序列。

示例：使用start()、end()、group() 查找所有匹配正则条件的子序列

public static void main(String[] args) {
    final String regex = "world";
    final String content = "helloworld helloworld";
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    System.out.println("content: " + content);

    int i = 0;
    while (m.find()) {
        i++;
        System.out.println("[" + i + "th] found");
        System.out.print("start: " + m.start() + ", ");
        System.out.print("end: " + m.end() + ", ");
        System.out.print("group: " + m.group() + "\n");
    }
}

输出：

content: helloworld helloworld
[1th] found
start: 5, end: 10, group: world
[2th] found
start: 16, end: 21, group: world

替换匹配正则规则的文本

替换方法是替换输入字符串里文本的方法：

方法及说明
public Matcher appendReplacement(StringBuffer sb, String replacement)实现非终端添加和替换步骤。
public StringBuffer appendTail(StringBuffer sb)实现终端添加和替换步骤。
public String replaceAll(String replacement) 替换模式与给定替换字符串相匹配的输入序列的每个子序列。
public String replaceFirst(String replacement) 替换模式与给定替换字符串匹配的输入序列的第一个子序列。
public static String quoteReplacement(String s)返回指定字符串的字面替换字符串。这个方法返回一个字符串，就像传递给Matcher类的appendReplacement 方法一个字面字符串一样工作。

① 范例：replaceFirst vs replaceAll

public static void main(String[] args) {
    String regex = "can";
    String replace = "can not";
    String content = "I can because I think I can.";

    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);

    System.out.println("content: " + content);
    System.out.println("replaceFirst: " + m.replaceFirst(replace));
    System.out.println("replaceAll: " + m.replaceAll(replace));
}

replaceFirst：替换第一个匹配正则规则的子序列。

replaceAll：替换所有匹配正则规则的子序列。

② 范例：appendReplacement、appendTail和replaceAll

public static void main(String[] args) {
    String regex = "can";
    String replace = "can not";
    String content = "I can because I think I can.";
    StringBuffer sb = new StringBuffer();
    StringBuffer sb2 = new StringBuffer();

    System.out.println("content: " + content);
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    while (m.find()) {
        m.appendReplacement(sb, replace);
    }
    System.out.println("appendReplacement: " + sb);
    m.appendTail(sb);
    System.out.println("appendTail: " + sb);
}

从输出结果可以看出，appendReplacement和appendTail方法组合起来用，功能和replaceAll是一样的。

如果你查看replaceAll的源码，会发现其内部就是使用appendReplacement和appendTail方法组合来实现的。

③ 范例：quoteReplacement和replaceAll，解决特殊字符替换问题

public static void main(String[] args) {
    String regex = "\\$\\{.*?\\}";
    String replace = "${product}";
    String content = "product is ${productName}.";

    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    String replaceAll = m.replaceAll(replace);

    System.out.println("content: " + content);
    System.out.println("replaceAll: " + replaceAll);
}

String regex = "\\$\\{.*?\\}";表示匹配类似${name}这样的字符串。由于$、{ 、}都是特殊字符，需要用反义字符\来修饰才能被当做一个字符串字符来处理。

上面的例子是想将 ${productName} 替换为 ${product} ，然而replaceAll方法却将传入的字符串中的$当做特殊字符来处理了。结果产生异常。

如何解决这个问题?

JDK1.5引入了quoteReplacement方法。它可以用来转换特殊字符。其实源码非常简单，就是判断字符串中如果有\或$，就为它加一个转义字符\

我们对上面的代码略作调整：

m.replaceAll(replace)改为m.replaceAll(Matcher.quoteReplacement(replace))，新代码如下：

public static void main(String[] args) {
    String regex = "\\$\\{.*?\\}";
    String replace = "${product}";
    String content = "product is ${productName}.";

    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(content);
    String replaceAll = m.replaceAll(Matcher.quoteReplacement(replace));

    System.out.println("content: " + content);
    System.out.println("replaceAll: " + replaceAll);
}

二、正则表达式语法规则

正则表达式：正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

元字符：元字符(metacharacters)就是正则表达式中具有特殊意义的专用字符。

普通字符：普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

元字符

基本元字符

正则表达式的元字符难以记忆，很大程度上是因为有很多为了简化表达而出现的等价字符。而实际上最基本的元字符，并没有那么多。对于大部分的场景，基本元字符都可以搞定。

① 多选 - |

匹配一个确定的字符串

checkMatches("abc", "abc");

如果要匹配一个确定的字符串，非常简单，如上所示。

如果你不确定要匹配的字符串，希望有多个选择，怎么办？

答案是：使用元字符| ，它的含义是或。

// 测试正则表达式字符， 匹配多个可选的字符串：|
Assert.assertTrue(checkMatches("yes|no", "yes"));
Assert.assertTrue(checkMatches("yes|no", "no"));
Assert.assertFalse(checkMatches("yes|no", "right"));

② 分组 - ()

如果你希望表达式由多个子表达式组成，你可以使用 ()。

Assert.assertTrue(checkMatches("(play|end)(ing|ed)", "ended"));
Assert.assertTrue(checkMatches("(play|end)(ing|ed)", "ending"));
Assert.assertTrue(checkMatches("(play|end)(ing|ed)", "playing"));
Assert.assertTrue(checkMatches("(play|end)(ing|ed)", "played"));

③ 指定单字符有效范围 - []

前面展示了如何匹配字符串，但是很多时候你需要精确的匹配一个字符，这时可以使用[] 。

字符在指定范围：

// 测试正则表达式字符：[]
Assert.assertTrue(checkMatches("[abc]", "b"));  // 字符只能是a、b、c
Assert.assertTrue(checkMatches("[a-z]", "m")); // 字符只能是a - z
Assert.assertTrue(checkMatches("[A-Z]", "O")); // 字符只能是A - Z
Assert.assertTrue(checkMatches("[a-zA-Z]", "K")); // 字符只能是a - z和A - Z
Assert.assertTrue(checkMatches("[a-zA-Z]", "k"));
Assert.assertTrue(checkMatches("[0-9]", "5")); // 字符只能是0 - 9

④ 指定单字符无效范围 - [^]

字符串不能在指定范围。

如果需要匹配一个字符的逆操作，即字符不能在指定范围，可以使用[^]。

// 测试正则表达式字符：[^]
Assert.assertFalse(checkMatches("[^abc]", "b")); // 字符不能是a、b、c
Assert.assertFalse(checkMatches("[^a-z]", "m")); // 字符不能是a - z
Assert.assertFalse(checkMatches("[^A-Z]", "O")); // 字符不能是A - Z
Assert.assertFalse(checkMatches("[^a-zA-Z]", "K")); // 字符不能是a - z和A - Z
Assert.assertFalse(checkMatches("[^a-zA-Z]", "k"));
Assert.assertFalse(checkMatches("[^0-9]", "5")); // 字符不能是0 - 9

⑤ 限制字符数量 - {}

如果想要控制字符出现的次数，可以使用{}。

字符	描述
`{n}`	n 是一个非负整数。匹配确定的 n 次。
`{n,}`	n 是一个非负整数。至少匹配 n 次。
`{n,m}`	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。

限制字符出现次数：

// {n}: n 是一个非负整数。匹配确定的 n 次。
checkMatches("ap{1}", "a");
checkMatches("ap{1}", "ap");
checkMatches("ap{1}", "app");
checkMatches("ap{1}", "apppppppppp");

// {n,}: n 是一个非负整数。至少匹配 n 次。
checkMatches("ap{1,}", "a");
checkMatches("ap{1,}", "ap");
checkMatches("ap{1,}", "app");
checkMatches("ap{1,}", "apppppppppp");

// {n,m}: m 和 n 均为非负整数，其中 n <= m。最少匹配 n 次且最多匹配 m 次。
checkMatches("ap{2,5}", "a");
checkMatches("ap{2,5}", "ap");
checkMatches("ap{2,5}", "app");
checkMatches("ap{2,5}", "apppppppppp");

⑥ 转义字符 - \

如果想要查找元字符本身，你需要使用转义符，使得正则引擎将其视作一个普通字符，而不是一个元字符去处理。

* 的转义字符：\*
+ 的转义字符：\+
? 的转义字符：\?
^ 的转义字符：\^
$ 的转义字符：\$
. 的转义字符：\.

如果是转义符\本身，你也需要使用\\ 。

⑦ 指定表达式字符串的开始和结尾 - ^、$

如果希望匹配的字符串必须以特定字符串开头，可以使用^ 。

注：请特别留意，这里的^ 一定要和 [^] 中的 “^” 区分。

限制字符串头部：

Assert.assertTrue(checkMatches("^app[a-z]{0,}", "apple")); // 字符串必须以app开头
Assert.assertFalse(checkMatches("^app[a-z]{0,}", "aplause"));

如果希望匹配的字符串必须以特定字符串开头，可以使用$ 。

限制字符串尾部：

Assert.assertTrue(checkMatches("[a-z]{0,}ing$", "playing")); // 字符串必须以ing结尾
Assert.assertFalse(checkMatches("[a-z]{0,}ing$", "long"));

基本元字符的等价字符

等价字符，顾名思义，就是对于基本元字符表达的一种简化（等价字符的功能都可以通过基本元字符来实现）。

在没有掌握基本元字符之前，可以先不用理会，因为很容易把人绕晕。

等价字符的好处在于简化了基本元字符的写法。

表示某一类型字符的等价字符

下表中的等价字符都表示某一类型的字符。

字符	描述
`.`	匹配除“\n”之外的任何单个字符。
`\d`	匹配一个数字字符。等价于[0-9]。
`\D`	匹配一个非数字字符。等价于[^0-9]。
`\w`	匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”，这里的单词字符指的是Unicode字符集。
`\W`	匹配任何非单词字符。
`\s`	匹配任何不可见字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
`\S`	匹配任何可见字符。等价于[ \f\n\r\t\v]。

基本等价字符的用法：

// 匹配除“\n”之外的任何单个字符
Assert.assertTrue(checkMatches(".{1,}", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_"));
Assert.assertTrue(checkMatches(".{1,}", "~!@#$%^&*()+`-=[]{};:<>,./?|\\"));
Assert.assertFalse(checkMatches(".", "\n"));
Assert.assertFalse(checkMatches("[^\n]", "\n"));

// 匹配一个数字字符。等价于[0-9]
Assert.assertTrue(checkMatches("\\d{1,}", "0123456789"));
// 匹配一个非数字字符。等价于[^0-9]
Assert.assertFalse(checkMatches("\\D{1,}", "0123456789"));

// 匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”，这里的单词字符指的是Unicode字符集
Assert.assertTrue(checkMatches("\\w{1,}", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_"));
Assert.assertFalse(checkMatches("\\w{1,}", "~!@#$%^&*()+`-=[]{};:<>,./?|\\"));
// 匹配任何非单词字符
Assert.assertFalse(checkMatches("\\W{1,}", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_"));
Assert.assertTrue(checkMatches("\\W{1,}", "~!@#$%^&*()+`-=[]{};:<>,./?|\\"));

// 匹配任何不可见字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]
Assert.assertTrue(checkMatches("\\s{1,}", " \f\r\n\t"));
// 匹配任何可见字符。等价于[^ \f\n\r\t\v]
Assert.assertFalse(checkMatches("\\S{1,}", " \f\r\n\t"));

限制字符数量的等价字符

在基本元字符章节中，已经介绍了限制字符数量的基本元字符 - {} 。

此外，还有 *、+、? 这个三个为了简化写法而出现的等价字符，我们来认识一下。

字符	描述
`*`	匹配前面的子表达式零次或多次。等价于{0,}。
`+`	匹配前面的子表达式一次或多次。等价于{1,}。
`?`	匹配前面的子表达式零次或一次。等价于 {0,1}。

限制字符数量的等价字符：

// *: 匹配前面的子表达式零次或多次。* 等价于{0,}。
checkMatches("ap*", "a");
checkMatches("ap*", "ap");
checkMatches("ap*", "app");
checkMatches("ap*", "apppppppppp");

// +: 匹配前面的子表达式一次或多次。+ 等价于 {1,}。
checkMatches("ap+", "a");
checkMatches("ap+", "ap");
checkMatches("ap+", "app");
checkMatches("ap+", "apppppppppp");

// ?: 匹配前面的子表达式零次或一次。? 等价于 {0,1}。
checkMatches("ap?", "a");
checkMatches("ap?", "ap");
checkMatches("ap?", "app");
checkMatches("ap?", "apppppppppp");

元字符优先级

正则表达式从左到右进行计算，并遵循优先级顺序，这与算术表达式非常类似。

下表从最高到最低说明了各种正则表达式运算符的优先级顺序：

运算符	说明
\	转义符
(), (?, (?=), []	括号和中括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, 任何元字符、任何字符	定位点和序列
\|	替换

字符具有高于替换运算符的优先级，使得“m|food”匹配“m”或“food”。若要匹配“mood”或“food”，请使用括号创建子表达式，从而产生“(m|f)ood”。

速查元字符字典

为了方便快查正则的元字符含义，在本节根据元字符的功能集中罗列正则的各种元字符。

限定符

字符	描述
`*`	匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
`+`	匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
`?`	匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。
`{n}`	n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
`{n,}`	n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
`{n,m}`	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

定位符

字符	描述
`^`	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。
`$`	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。
`\b`	匹配一个字边界，即字与空格间的位置。
`\B`	非字边界匹配。

非打印符

字符	描述
`\cx`	匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
`\f`	匹配一个换页符。等价于 \x0c 和 \cL。
`\n`	匹配一个换行符。等价于 \x0a 和 \cJ。
`\r`	匹配一个回车符。等价于 \x0d 和 \cM。
`\s`	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
`\S`	匹配任何非空白字符。等价于 [^\f\n\r\t\v]。
`\t`	匹配一个制表符。等价于 \x09 和 \cI。
`\v`	匹配一个垂直制表符。等价于 \x0b 和 \cK。

分组

表达式	描述
`(exp)`	匹配的子表达式。()中的内容就是子表达式。
`(?<name>exp)`	命名的子表达式（反向引用）。
`(?:exp)`	非捕获组，表示当一个限定符应用到一个组，但组捕获的子字符串并非所需时，通常会使用非捕获组构造。
`(?=exp)`	匹配exp前面的位置。
`(?<=exp)`	匹配exp后面的位置。
`(?!exp)`	匹配后面跟的不是exp的位置。
`(?<!exp)`	匹配前面不是exp的位置。

特殊字符

字符	描述
`\`	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\' 匹配 ""，而 '(' 则匹配 "("。
`\\|`	指明两项之间的一个选择。
`[]`	匹配方括号范围内的任意一个字符。形式如：[xyz]、[xyz]、[a-z]、[a-z]、[x,y,z]

三、正则表达式实例

校验中文

校验字符串中只能有中文字符（不包括中文标点符号）。中文字符的Unicode编码范围是\u4e00 到 \u9fa5。

^[\u4e00-\u9fa5]+$

匹配：春眠不觉晓
不匹配：春眠不觉晓，

校验身份证号

身份证为15位或18位。15位是第一代身份证。从1999年10月1日起，全国实行公民身份证号码制度，居民身份证编号由原15位升至18位。

15位身份证：由15位数字组成。排列顺序从左至右依次为：六位数字地区码；六位数字出生日期；三位顺序号，其中15位男为单数，女为双数。

18位身份证：由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为：六位数字地区码；八位数字出生日期；三位数字顺序码和一位数字校验码（也可能是X）。

① 地区码

(1[1-5]|2[1-3]|3[1-7]|4[1-3]|5[0-4]|6[1-5])\d{4}

② 出生日期

注：下面的是18位身份证的有效出生日期，如果是15位身份证，只要将第一个\d{4}改为\d{2}即可。

((\d{4}((0[13578]|1[02])(0[1-9]|[12]\d|3[01])|(0[13456789]|1[012])(0[1-9]|[12]\d|30)|02(0[1-9]|1\d|2[0-8])))|([02468][048]|[13579][26])0229)

15位有效身份证校验：

^((1[1-5]|2[1-3]|3[1-7]|4[1-3]|5[0-4]|6[1-5])\d{4})((\d{2}((0[13578]|1[02])(0[1-9]|[12]\d|3[01])|(0[13456789]|1[012])(0[1-9]|[12]\d|30)|02(0[1-9]|1\d|2[0-8])))|([02468][048]|[13579][26])0229)(\d{3})$

18位有效身份证校验：

^((1[1-5]|2[1-3]|3[1-7]|4[1-3]|5[0-4]|6[1-5])\d{4})((\d{4}((0[13578]|1[02])(0[1-9]|[12]\d|3[01])|(0[13456789]|1[012])(0[1-9]|[12]\d|30)|02(0[1-9]|1\d|2[0-8])))|([02468][048]|[13579][26])0229)(\d{3}(\d|X))$

校验有效用户名、密码

长度为6-18个字符，允许输入字母、数字、下划线，首字符必须为字母。

^[a-zA-Z]\w{5,17}$

匹配：he_llo@worl.d.com | hel.l-o@wor-ld.museum | h1ello@123.com
不匹配：hello@worl_d.com | he&llo@world.co1 | .hello@wor#.co.uk

校验时间

校验时间。时、分、秒必须是有效数字，如果数值不是两位数，十位需要补零。

^([0-1][0-9]|[2][0-3]):([0-5][0-9])$

匹配：00:00:00 | 23:59:59 | 17:06:30
不匹配：17:6:30 | 24:16:30

校验日期

校验日期。日期满足以下条件：

格式yyyy-MM-dd或yyyy-M-d
连字符可以没有或是“-”、“/”、“.”之一
闰年的二月可以有29日；而平年不可以。
一、三、五、七、八、十、十二月为31日。四、六、九、十一月为30日。

^(?:(?!0000)[0-9]{4}([-/.]?)(?:(?:0?[1-9]|1[0-2])\1(?:0?[1-9]|1[0-9]|2[0-8])|(?:0?[13-9]|1[0-2])\1(?:29|30)|(?:0?[13578]|1[02])\1(?:31))|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)([-/.]?)0?2\2(?:29))$

匹配：2016/1/1 | 2016/01/01 | 20160101 | 2016-01-01 | 2016.01.01 | 2000-02-29
不匹配：2001-02-29 | 2016/12/32 | 2016/6/31 | 2016/13/1 | 2016/0/1

校验中国手机号码

中国手机号码正确格式：11位数字。

移动有16个号段：134、135、136、137、138、139、147、150、151、152、157、158、159、182、187、188。其中147、157、188是3G号段，其他都是2G号段。
联通有7种号段：130、131、132、155、156、185、186。其中186是3G（WCDMA）号段，其余为2G号段。
电信有4个号段：133、153、180、189。其中189是3G号段（CDMA2000），133号段主要用作无线网卡号。
总结：13开头手机号0-9；15开头手机号0-3、5-9；18开头手机号0、2、5-9。

此外，中国在国际上的区号为86，所以手机号开头有+86、86也是合法的。

^((\+)?86\s*)?((13[0-9])|(15([0-3]|[5-9]))|(18[0,2,5-9]))\d{8}$

匹配：+86 18012345678 | 86 18012345678 | 15812345678
不匹配：15412345678 | 12912345678 | 180123456789

校验中国固话号码

固话号码，必须加区号（以0开头）。

3位有效区号：010、020~029，固话位数为8位。
4位有效区号：03xx开头到09xx，固话位数为7。

^(010|02[0-9])(\s|-)\d{8}|(0[3-9]\d{2})(\s|-)\d{7}$

匹配：010-12345678 | 010 12345678 | 0512-1234567 | 0512 1234567
不匹配：1234567 | 12345678

校验IPv4地址

IP地址是一个32位的二进制数，通常被分割为4个“8位二进制数”（也就是4个字节）。IP地址通常用“点分十进制”表示成（a.b.c.d）的形式，其中，a,b,c,d都是0~255之间的十进制整数。

^([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])$

匹配：0.0.0.0 | 255.255.255.255 | 127.0.0.1
不匹配：10.10.10 | 10.10.10.256

特定字符

匹配长度为3的字符串：^.{3}$。

匹配由26个英文字母组成的字符串：^[A-Za-z]+$。

匹配由26个大写英文字母组成的字符串：^[A-Z]+$。

匹配由26个小写英文字母组成的字符串：^[a-z]+$。

匹配由数字和26个英文字母组成的字符串：^[A-Za-z0-9]+$。

匹配由数字、26个英文字母或者下划线组成的字符串：^\w+$。

特定数字

匹配正整数：^[1-9]\d*$

匹配负整数：^-[1-9]\d*$

匹配整数：^(-?[1-9]\d*)|0$

匹配正浮点数：^[1-9]\d*\.\d+|0\.\d+$

匹配负浮点数：^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$

匹配浮点数：^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

四、参考

https://www.cnblogs.com/jingmoxukong/p/6026474.html

https://www.cnblogs.com/jingmoxukong/p/6030197.html

https://www.cnblogs.com/jingmoxukong/p/6040572.html

codedot

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录