正则表达式常用字符开箱即用
1、元字符
- \b 表示单词的开头或者结尾 表示分界处 | \bhello\b
- \d 表示数字 | 0\d/d & 012
- \s 表示匹配一个字符/特殊符号(任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格)
- \w 字母或数字或下划线或汉字
- ^ 表示开头
- $ 表示结尾
- \ 用作字符转义 如 \.
2、限定符
- + 表示至少出现一次或者更多
- * 表示零次或者多次
- ? 表示零次或者一次
- {n} 重复n次
- {n,m} 重复n到m次
- {n,} 重复n次或者更多次
- {,n} 重复不超过n次
3、范围限定
- [] 表示限定范围内的字符 [a-z] 只能使用a-z 的字符 [*()] 只能使用 *()
4、分歧条件
- | 表示匹配 | 左右两边的都行 \w|\d 能匹配字符能匹配数字 从左到右开始匹配 满足左边就不会继续匹配右边
5、反义
- \W 匹配的不是任意的字母或数字或下划线或汉字
- \S 匹配的不是空白的字符
- \D 匹配任意非数字的字符
- \B 匹配不是单词开头的字符
- [^x] 匹配除了x以外的字符
6、后向引用
- (?<name>x) 表示将x正则保存成分组 name
- \1 没有带<name>的会被自动分组 然后通过数字进行引用 \b(\w+)\b\s+\1\b 这里\1引用的就是(\w+)
- (?:exp) 匹配exp 但是不会自动分组 就是上面的\1引用不了
7、零宽断言
- (?=exp) 匹配exp前面的位置
- (?<=exp) 匹配exp后面的位置
- (?!exp) 匹配后面跟的不是exp的位置
- (?<!exp) 匹配前面跟的不是exp的位置
- (?#comment) 表示注释 不影响正则生效
8、贪婪和懒惰
- *? 表示重复任意次 尽可能少的匹配 ajkljbkldjfb 加?匹配 ajkljb 不加ajkljbkldjfb
- +? 表示重复一次或更多次 尽可能少的匹配
- ?? 表示重复一次或者零次 尽可能少的匹配
- {n,m} 重复n到m次 可能少的匹配