正则表达式

最新推荐文章于 2022-05-25 11:03:15 发布

小陌白

最新推荐文章于 2022-05-25 11:03:15 发布

阅读量80

点赞数

分类专栏： Java后端的学习文章标签：正则表达式字符串 java

本文链接：https://blog.csdn.net/weixin_48842132/article/details/119743379

版权

21 篇文章 1 订阅

订阅专栏

正则表达式（Regular Expression)

字母、数字、汉字、下划线、以及没有特殊定义的标点符号，都是“普通字符” 。表达式中的普通字符，在匹配一个字符串的时候，匹配与之相同的一个字符。

\d	任意一个数字，0~9中的任意一个，等价于[0-9]
\w	任意一个字母或数字或下划线，也就是A_Z，az, 0~9, _中任意一个
\s	包括空格、制表符、换行符等空白字符的其中任意一个
.	小数点可以匹配任意一个字符（除了换行符）如果要匹配包括“\n”在内的所有字符，一般用[\s\S]

[]方括号匹配方式，能够匹配方括号中任意一个字符

正则表达式的特殊符号，被包含到中括号中，则失去特殊意义，除了^, -之外。

标准字符集合，除小数点外，如果被包括于中括号，自定义字符集合将包含该集合。比如：

修饰匹配次数的特殊符号

^	与字符串开始的地方匹配	^abc表示abc且在一个字符串的开头
$	与字符串结束的地方匹配	abc$表示abc且在一个字符串的结尾
\b	匹配一个单词边界

IGNORECASE 忽略大小写模式
- 匹配时忽略大小写
- 默认情况下，正则表达式是要区分大小写的
SINGLELINE 单行模式
- 整个文本看作一个字符串，只有一个开头，一个结尾。
- 使小数点"."可以匹配包含换行符（\n）在内的任意字符。
MULTILINE 多行模式
- 每行都是一个字符串，都有开头和结尾
- 在指定了MULTILINE之后，如果需要仅匹配字符串开始和结束位置，可以使用\A和\Z

表达式	作用
\| 分支结构	左右两边表达式之间”或“关系，匹配左边或者右边
( ) 捕获组	(1).在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰 (2).取匹配结果的时候，括号中的表达式匹配到的内容可以被单独得到 (3).每一对括号会分配一个编号，使用()的捕获根据左括号的顺序从1开始自动编号。捕获元素编号为零的第一个捕获是由整个正则表达式模式匹配的文本。
(?:Expression) 非捕获组	一些表达式中，不得不使用( )，但又不需要保存( )中子表达式匹配的内容，这时可以用非捕获组来抵消使用( ) 带来的副作用。

反向引用（\nnn)
- 每一对()会分配一个编号，使用()的捕获根据左括号的顺序从1开始自动编号。
- 通过反向引用，可以对分组已捕获的字符串进行引用

只进行子表达式的匹配，匹配内容不计入最终的匹配结果，是零宽度。
这个位置应该符合某个条件。判断当前位置的前后字符，是否符合指定的条件，但不匹配前后的字符。是对位置的匹配。
正则表达式匹配过程中，如果子表达式匹配到的是字符内容，而非位置，并被保存到最终的匹配结果中，那么就认为这个子表达式是占有字符的；如果子表达式匹配的仅仅是位置，或者匹配的内容并不保存到最终的匹配结果中，那么就认为这个子表达式是零宽度的。占有字符还是零宽度，是针对匹配的内容是否保存到最终的匹配结果中而言的。

(?=exp)	断言自身出现的位置的后面能匹配表达式exp放其他语句后面
(?<=exp)	断言自身出现的位置的前面能匹配表达式exp放其他语句前面
(?!exp)	断言此位置的后面不能匹配表达式exp
(?<!exp)	断言此位置的前面不能匹配表达式exp

相关类位于：java.util.regex包下面
类 Pattern：
- 正则表达式的编译表示形式。
- Pattern p = Pattern.compile(r, int); // 建立正则表达式，并启用相应模式
类 Matcher:
- 通过解释Pattern对character sequence 执行匹配操作的引擎
- Matcher m = p.matcher(str); // 匹配str字符串