正则表达式

最新推荐文章于 2024-05-20 10:35:51 发布

qq_29856871

最新推荐文章于 2024-05-20 10:35:51 发布

阅读量222

点赞数

本文链接：https://blog.csdn.net/qq_29856871/article/details/47090751

版权

正则表达式

正则表达式用于操作字符串数据, 通过一些特定的符号来体现的。
所以我们为了掌握正则表达式，必须要学习一些符号。
简化了书写,阅读型会差.

常见符号

字符

x 字符 x
\\ 反斜线字符
\t 制表符 ('\u0009')
\n 新行（换行）符 ('\u000A')
\r 回车符 ('\u000D')
\f 换页符 ('\u000C')
\a 报警 (bell) 符 ('\u0007')
字符类

[abc] a、b或 c（简单类）
[^abc] 任何字符，除了 a、b或 c（否定）
[a-zA-Z] a到 z或 A 到 Z，两头的字母包括在内（范围）
[a-d[m-p]] a到 d或 m 到 p：[a-dm-p]（并集）
[a-z&&[def]] d、e或 f（交集）
[a-z&&[^bc]] a到 z，除了 b和 c：[ad-z]（减去）
[a-z&&[^m-p]] a到 z，而非 m到 p：[a-lq-z]（减去）
预定义字符类

. 任何字符（与行结束符可能匹配也可能不匹配）
\d 数字：[0-9]
\D 非数字： [^0-9]
\s 空白字符：[ \t\n\x0B\f\r]
\S 非空白字符：[^\s]
\w 单词字符：[a-zA-Z_0-9]
\W 非单词字符：[^\w]
边界匹配器

^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾，仅用于最后的结束符
\z 输入的结尾
Greedy数量词

X? X，一次或一次也没有
X* X，零次或多次
X+ X，一次或多次
X{n} X，恰好 n次
X{n,} X，至少 n次
X{n,m} X，至少 n次，但是不超过 m 次
组和捕获

捕获组可以通过从左到右计算其开括号来编号。例如，在表达式 ((A)(B(C)))中，存在四个这样的组：
1 ((A)(B(C)))
2 \A
3 (B(C))
4 (C)
组零始终代表整个表达式。在替换中常用$匹配组的内容。

matches(String regex) :告知此字符串是否匹配给定的正则表达式
pattern() : 返回在其中编译过此模式的正则表达式。
Pattern类为正则表达式的编译表示形式。指定为字符串的正则表达式必须首先被编译为此类的实例。然后，可将得到的模式用于创建Matcher对象，依照正则表达式，该对象可以与任意字符序列匹配。执行匹配所涉及的所有状态都驻留在匹配器中，所以多个匹配器可以共享同一模式。

正则表达式常见功能：匹配、切割、替换、获取

匹配：String类中的matches方法。
切割：其实就是String泪中的split()方法。
替换：其实使用的就是String类中的replaceAll()方法
获取：
将正则规则进行对象的封装，
通过正则对象的matcher方法与字符串关联，获取要对字符串操作的匹配器对象Matcher。
通过Matcher匹配器对象的方法对字符串操作。