字符匹配
- . 匹配任意单个字符(除了\n),可以是一个汉字或其他国家的文字
- [] 匹配指定范围内的任意字符,示例: [guo] [0-9] [a-z] [a-zA-Z]
- [^] 匹配指定范围外的任意单个字符,示例:[^guo]
- [:alnum:] 字母和数字
- [:alpha:] 代表任何英文大小写字符,亦即 A-Z,a-z
- [:lower:] 小写字母,示例:[[:lower:]],相当于[a-z]
- [:upper:] 大写字母
- [:blank:] 空白字符(空格和制表符)
- [:space:] 包括空格、制表符(水平和垂直)、换行符、回车符等各类型的空白,比[:blank:]包含的范围广
- [:cntrl:] 不可打印的控制字符(退格、删除、警铃.....)
- [:digit:] 十进制数字
- [:xdigit:] 十六进制数字
- [:graph:] 可打印的非空白字符
- [:print:] 可打印字符
- [:punct:] 标点符号
- \s 匹配任何空白的字符,包括空格、制表符、换页符等等,等价于[\f\r\t\v]。注意Unicode 正则表达式会匹配全角空格符
- \S 匹配任何非空白字符,等价于[^\f\r\t\v]
- \w 匹配一个字母、数字、下划线、汉字、其他国家文字的字符,等价于[_[:alnum:]字]
- \W 匹配一个非字母、数字、下划线、汉字、其他国家文字的字符,等价于[^_[:alnum:]字]
匹配次数
- *:匹配前面的字符任意次,包括0次,贪婪模式:尽可能长的匹配
- .*: 任意长度的字符,相当于通配符的*
- \?:匹配前面的字符出现0次或1次,即可有可无
- \+:匹配前面的字符出现最少1次,即肯定有并且>=1次
- \{n\}:匹配前面的字符n次
- \{m,n\}:匹配前面的字符至少m次,至多n次
- \{,n\}:匹配前面的字符至多n次,<=n
- \{n,\}:匹配前面的字符至少n次
位置锚定
- ^:行首锚定,用于模式的最左侧
- $:行尾锚定,用于模式的最右侧
- ^PATTERN$:用于模式匹配整行
- ^$:空行
- ^[[:space:]]*$:空白行
- \< 或 \b :词首锚定,用于单词模式的左侧 注意g-guo 查guo为词首也是可以查到的
- \>或\b :词尾锚定,用于单词模式的右侧
- \<PATTERN\> :匹配整个单词
分组
()将多个字符捆绑在一起,当作一个整体处理,如:\(root\)+
\| 示例:
- a\|b a或者b
- C\|cat C或cat
- \(C\|c\)at Cat或者cat