正则表达式中有很多具有特别意义的字符。首先是下列字符:
[ ]:范围描述符。[a-z]表示从a到z之间的任意一个。
\w:英文字母和数字。即[0-9 A-Z a-z]。
\W:非英文字母和数字
\s:空字符,即[\t\n\r\f]。其中\t制表符匹配,\n换行符匹配,\r匹配一个回车符,\f换页符匹配。
\S:非空字符。
\d:数字,即[0-9]。
\D:非数字。
*:前面元素出现0次以上
+:前面元素出现1次以上
{m,n}:前面元素最少出现m次,最多出现n次
?:前面元素出现0次或1次
|:选择
\:将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\n”匹配换行符。序列“\\”匹配“\”,“\(”匹配“(”。
^:匹配输入字符串开始的位置
$:匹配输入字符串结尾的位置
.:匹配除“\n”之外的任何单个字符
[^a-z]:反向范围字符。匹配不在指定的范围内的任何字符。例如,“[^a-z]”匹配任何不在“a”到“z”范围内的任何字符。