JAVA正则表达式

最新推荐文章于 2024-07-27 18:40:58 发布

StrarryEyes

最新推荐文章于 2024-07-27 18:40:58 发布

阅读量1.6k

点赞数

分类专栏： Java word文档文章标签：正则表达式 java

本文链接：https://blog.csdn.net/m0_64039166/article/details/124979418

版权

3 篇文章 0 订阅

订阅专栏

正则表达式（Regular Expression）是一种字符串匹配模式，包括普通字符（例如，a到z之间的字母）和特殊字符（元字符），可以被用来匹配、拆分和替换字符串。

1.正则表达式的语法和功能

String类中的matches方法与equals方法类似，例如，以下两个语句结果都为true.

“Java”.matches(“Java”);

“Java”.equals(“Java”);

然而，matches方法功能更加强大，matches方法不仅可以匹配一个固定的字符串，还可以匹配符合一个模式的字符串集。例如，以下语句结果都为true.

“Java is fun”.matches(“Java.*”);

“Java is cool”.matches(“Java.*”);

“Java is powerful”.matches(“Java.*”);

以上语句中的“Java.*”是一个正则表达式，它描述了一个字符串模式，以Java开始，后面跟0个或多个字符串。其中，子字符串.*匹配0个或者多个任意字符。

用正则表达式表示手机号码：

用正则表达式表示QQ邮箱：

构造正则表达式就是用多种元字符与运算符将简单表达式结合起来创建一个复杂的表达式。正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。它是一种由普通字符和特殊字符组成的文字模式。

包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

许多元字符在匹配时，必须首先使字符"转义"，即，将反斜杠字符\ 放在它们前面。

字符	描述
$	匹配输入字符串的结尾位置。用 \$匹配 $.
()	标记子表达式的开始和结束位置。使用 $ 和 $匹配这些字符。
*	匹配前面的子表达式零次或多次。用 \匹配字符。
+	匹配前面的子表达式一次或多次。用 \+匹配 + 字符。
.	匹配除换行符 \n 之外的任何单字符。使用 \. 匹配 . 。
[	标记一个中括号表达式的开始。用 \[匹配 [。
?	匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。
\	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\"，而 '\(' 则匹配 "("。
^	匹配输入字符串的开始位置，除非在方括号表达式中使用，当该符号在方括号表达式中使用时，表示不接受该方括号表达式中的字符集合。要匹配 ^ 字符本身，请使用 \^。
{	标记限定符表达式的开始。
\|	指明两项之间的一个选择。

限定符可以限定一个正则表达式中一个给定组件的出现次数。

字符	描述
*	匹配前面的子表达式零次或者多次。例如，ap*能匹配“a”以及“app”,等价于{0，}。
+	匹配前面的子表达式一次或者多次。例如，‘zo+’能匹配“zo”以及“zoo”,但不能匹配“z”，+等价于{1,}。
？	匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 、 "does" 中的 "does" 、 "doxy" 中的 "do" 。? 等价于 {0,1}。
{n}	n是一个非负整数。匹配n次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配“food”中的两个“o”。
{n,}	n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "zooooo" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m}	m和n均为非负整数，且n<=m。最少匹配n次，最多匹配m次。例如，“o{1,3}”将匹配“zoooooo”中的前三个o。‘o{1,3}’等价于‘o?’。需注意逗号和两个数之间没有空格。

定位符的功能是被用来描述一个字符串或者单词的边界，需注意的是由于在紧靠换行或者单词边界的前面后者后面不能有一个以上的位置，所以不能把定位符和限定符放在一起使用。