正则表达式是用于文本匹配的工具,它在源字符串中查找与给定的正则表达式相匹配的部分。一个正则表达式是由字母、数字和特殊字符(括号、星号、问号等)组成。正则表达式中有许多特殊的字符,这些特殊字符是构成正则表达式的要素。
正则表达式中的特殊字符
符号 | 描述 |
---|---|
^ | 正则表达式开始的字符 |
$ | 正则表达式结束的字符 |
\w | 匹配字符、数字、下划线 |
\W | 匹配不死字符、数字、下划线 |
\s | 匹配空白字符 |
\S | 匹配不是空白字符 |
\d | 匹配数字 |
\D | 匹配不是数字 |
. | 匹配任意字符,包括汉字 |
( ) | 对正则表达式进行分组,一对元括号表示一组 |
[ ] | 指定一个匹配范围 |
{ } | 控制字符重复的次数 |
[m] | 匹配单个字符 |
[m-n] | 匹配m到n区间的数字、字母 |
[^m] | 匹配除m以外的字符串 |
正则表达式中的常用限定符
符号 | 描述 |
---|---|
* | 匹配零次或多次 |
+ | 匹配一次或多次 |
? | 匹配一次或零次 |
{m} | 重复m次 |
{m,n} | 重复m到n次(m - n-1),其中n可以省略,表示m到任意次 |
" ( “、” ) “、” [ " 、" ] “、” { “、” } "等都是正则表达式中的特殊字符,如果要把他们作为普通字符处理,需要在前面添加转义字符 " \ "。