-
贪婪与懒惰
-
- 贪婪的重复
-
懒惰的重复
-
常见的正则表达式
简单来说,正则表达式就是用一些特定的符号来代替字符串
| 代码 | 说明 |
| — | — |
| . | 匹配除\n以外的任意字符 |
| \w | 匹配数字或字母或 _ |
| \W | 匹配非数字或字母或 _ |
| \s | 匹配任意的空白符(空格,换行,字表符) |
| \S | 匹配非空白符 |
| \d | 匹配所有数字 |
| \D | 匹配非数字 |
| \b | 匹配单词的开始或结束(边界) |
| \B | 匹配非单词边界 |
| ^ | 匹配字符串的开始 |
| $ | 匹配字符串的结束 |
| 代码 | 说明 |
| — | — |
| \f | 匹配一个换页符 |
| \n | 匹配一个换行符 |
| \r | 匹配一个回车符 |
| \t | 匹配一个水平制表符 |
| \v | 匹配一个垂直制表符 |
| * | 匹配* |
| . | 匹配. |
| \ | 匹配\ |
| 代码 | 说明 |
| — | — |
| x | y | 匹配x或y |
| [xyz] | 字符集合。匹配所包含的任意一个字符。例如’[abc]’ 可以匹配 “plain” 中的 ‘a’。 |
| [^xyz] | 负值字符集合。匹配未包含的任意字符。例如’[^abc]’ 可以匹配 “plain” 中的’p’、‘l’、‘i’、‘n’。 |
| [a-z] | 字符范围。匹配指定范围内的任意字符 |
| [^a-z] | 负值字符范围。匹配任何不在指定范围内的任意字符。 |
回到顶部 目录
| 分类 | 代码 | 说明 |
| — | — | — |
| 捕获 | (exp) | 匹配exp,并捕获文本到自动命名的组里面 |
| | (?exp) | 匹配exp,并捕获文本到名称为name的组里 |
| | (?:exp) | 匹配exp,不捕获匹配的文本,也不给此分组分配编号 |
| 零度断言 | (?=exp) | 匹配exp前面的位置 |
| | (?<=exp) | 匹配exp后面的位置 |
| | (?!exp) | 匹配后面跟着不是exp的位置 |
| | (?<!exp) | 匹配强面不是exp的位置 |
| 注释 | (?#comment) | 这种类型的分组不对正则表达式的处理产生任何影响,只是提供注释让人阅读 |
每使用一对()小括号,就是分了一个小组,并且每个小组都有一个编号
系统自动分配编号的原则是:
-
从左到右分配编号,第一个组是1,第二个是2,以此类推(正则表达式整体是一个组,编号为0)
-
实现上会从右到左查询两次,第一次给未命名的组分配组号,第二次给已命名的组分配组号
-
可以使用(?:xxx)的语法来让一个组不参与自动分配组号
后向引用
后向引用是指通过反斜杠\
加上 数字(编号)的方式来重复使用某一组的正则表达式
例如:(\d+)\s{1}\1
这个式子中可看出\d+
是第1组,编号就是1,后面的\1
就是引用了前面这一组的内容,相当于 (\d+)\s{1}(\d+)
零度断言
匹配宽度为0,在匹配元素的位置设置断点
比如一个字符串ddexpaa
dd(?=exp):匹配exp前面的dd
(?=exp)aa:匹配exp后面的aa