正则表达式是用于匹配某个具有一定规律的字符串的方法。正则表达式本身是一个字符串形式,它描述了一个字符串集合。
正则表达式的一般形式
正则表达式的一般形式为: ‘[]{}’。简单来说就是匹配什么样的字符串几次,即[什么字符]{几次}。[]里的内容表示匹配什么样的字符串,{}里的内容表明匹配几次前面[]里的字符串。比如[a-z]就是匹配小写字母,[^a-z]就是匹配除小写字母以外的其他字符;{0,}是匹配次数为[0, +∞ )。
正则表达式的简化符号
在正则表达式中,我们常见到的不是[]{}的形式,而是含有.?*+等字符。其实,这些字符都可以用[]{}里的内容代替,也就是这些字符是用来简写[]{}里的内容。常用的特殊字符中,表示[]中的含义的有:
符号 | 等价形式 |
---|---|
. | |
\d | [0-9] |
\w | [A-Za-z0-9] |
常用的特殊字符中,表示{}中的含义的有:
符号 | 等价形式 |
---|---|
* | {0,} |
+ | {1,} |
? | {0,1} |
正则表达式的特殊符号
在正则表达式中,并不是所有符号都是表示匹配什么字符或匹配几次的,也有一些符号表示一些其他含义。<