1.正则表达式中元字符总结:

 

* :重复*前面的那个字符0次或n次

. :表示任意一个字符

^ :匹配行首,表示行首的字符一定是^后面的那个字符

^:取反[^b-p] :表示不在b-p范围内的字符

$ : 匹配行尾,表示行尾的字符一定是$前面的那个字符

[] :字符集合;

[0-9] :匹配任意一个数字

[a-z] :匹配任意小写字母

[A-Z] :匹配任意大写字母

\ :转义符,屏蔽元字符的特殊意义

\<\> :表示精确匹配,\<the\> :表示包含the这个单词的哪一行,而不是字符串中包含the的哪一行

\{n\} :匹配前面的字符出现n次

\{n,\}:匹配前面的字符至少出现n次

\{n,m\} :匹配前面的字符出现n-m次

2.正则表达式的扩展

? :匹配?之前的那个字符0次或1次

+ :匹配+之前的那个字符1次或n次

() :可选字符集合,(a|b|c) 表示a b c三个字符的任意一个

| :或,匹配一组可选的字符

3.常用的元字符组合

.* :表示任意的字符串

^$ :表示空白行