1.普通字符
字母、数字、汉字、下划线、以及没有特殊定义的标点符号,都是‘’普通字符”,表达式中的普通字符,在匹配一 个字符串的时候,匹配与之相同的一个字符。
2.简单的转义字符
3.标准字符集合
能够与“多种字符”匹配的表达式;
区分大小写,大写是相反的意思。
4.自定义字符集合
(1) [ ]方括号匹配方式,能够匹配方括号中 任意一个字符。
(2)正则表达式的
特殊符号,被包含到
中括号中,则
失去特殊意义,除了
^和
-之外。
(3)标准字符集合,除小数点外,如果被包含于中括号,自定义字符集合将包含该集合。比如:
[\d.\-+]将匹配:数字或小数点或-或+
(3)标准字符集合,除小数点外,如果被包含于中括号,自定义字符集合将包含该集合。比如:
[\d.\-+]将匹配:数字或小数点或-或+
5.量词(Quantifier)
修饰匹配次数的特殊符号
(1)匹配次数中的
贪婪模式(匹配字符越多越好,默认!)
(2)匹配次数中的 非贪婪模式(匹配字符越少越好,修饰匹配次数的特殊符号后再加上一个”?”号)
5.字符边界
本组标记匹配的 不是字符而是位置,符合某种条件的位置,也即是 零宽度的。
\b匹配这样一个位置:前面的字符和后面的字符不全是\w(也即:
前后字符都满足\w就不匹配)。
6.匹配模式
- IGNORECASE忽略大小写模式
一默认情况下,正则表达式是要区分大小写的。
- SINGLELINE单行模式
一使用小数点"."可以匹配包含换行符(\n)在内的任意字符.
- MULTILINE多行模式
一在指定了MULTILINE之后,如果需要仅匹配字符串开始和结束位置,可以使用\A和\Z
7.选择符和分组
8.反向引用(\nnn)
每一对 ( )会分配一个编号,使用 ( )的捕获 根据左括号的顺序从1开始自动编号。通过反向引用,可与对 分组已捕获的字符串进行引用。