- 语系对正则表达式有一定影响。例如LANG=C 的字母大小写排列是分开的,LANG=zh_CN 的字母大小写是在一起的(a A)。
- 特殊符号表
特殊符号 | 代表意义 |
---|---|
[:alnum:] | 代表英文大小写字符及数字,即0~9、A~Z、a~z |
[:alpha:] | 代表任何英文大小写字符,即A~Z、a~z |
[:blank:] | 代表空格键与[Tab]按键 |
[:cntrl:] | 代表键盘上的控制键,包括CR、LF、Tab、Del |
[:digit:] | 代表数字,0~9 |
[:graph:] | 除了空格符(空格与Tab)外的其他所有按键 |
[:lower:] | 代表小写字符,a~z |
[:print:] | 代表任何可以被打印出来的字符 |
[:punct:] | 代表标点符号 |
[:upper:] | 代表大写字符,A~Z |
[:space:] | 任何会产生空白的字符,包括空格、Tab、CR等 |
[:xdigit:] | 代表十六进制的数字类型,包括0~9、A~F、a~f的数字与字符 |
- 利用[]来查找集合字符:
如果想同时找test或taste时候,可以:grep -n 't[ae]st' regular_express
查找大小写、数字:grep -n '[^a-zA-Z0-9]' regular_express.txt
还可以利用前面的特殊字符:grep -n '[[:lower:]]' regular_express.txt - 利用反向选择[^]:
查找包含oo的,但oo前面没有g:grep -n '[^g]oo' regular_express.txt
查找包含oo的,但前面没有小写字符:grep -n '[^a-z]oo' regular_express.txt - 行首与行尾字符^$:
只查找在行首出现的the:grep -n '^the' regular_express.txt
查找开头不是英文字母的:grep -n '^[^a-zA-Z]' regular_express.txt
查找行尾结束为小数点的(小数点有其他含义,需要转义符\):grep -n '\.$' regular_express.txt - 任意一个字符.与重复字符*:
.:表示一定有一个任意字符的意思
*:表示重复前一个0到无穷多次的意思
找出g??d字符,中间一定有两个: grep -n 'g..d' regular_express.txt
找出至少有两个o以上的字符:grep -n 'ooo*' regular_express.txt
找出g开头,g结尾的字符,中间无所谓: grep -n 'g.*g' regular_express.txt - 限定连续RE字符范围{}:
{}有特殊意义,需要转移符转为限定范围的意义
查找2到5个o的字符串:grep -n 'o\{2,5\}' regular_express.txt
- 基础正则表达式(grep)和扩展正则表达式(egrep)特殊字符归纳表
RE字符 | 意义 | 范例 |
^word | 待查找的字符串(word)在行首 | grep -n '^#' filename |
word$ | 待查找的字符串(word)在行尾 | grep -n '!$' filename |
. | 代表一定有一个任意字符的字符 | grep -n 'e.e' filename |
\ | 转义字符,将特殊符号的特殊意义去除 | grep -n \' filename |
* | 重复0到无穷多个的前一个字符 | grep -n 'o*' filename |
[list] | 从字符集合的RE字符里找出想要选取的字符 | grep -n '[[:lower:]]' filename |
[n1-n2] | 从字符集合的RE字符里面找出想选取的字符范围 | grep -n '[^a-zA-Z0-9]' filename |
[^list] | 从字符集合的RE字符里面找出不要的字符串或范围 | grep -n '[^a-z]oo' filename |
\{n,m\} | 连续n到m个的前一个RE字符 | grep -n 'o\{2,5\}' filename |
+ | 匹配前面的子表达式一次或多次,要匹配 + 字符,请使用 \+。 | egrep -n 'go+d' filename |
? | 匹配前面的子表达式零次或一次,要匹配 ? 字符,请使用 \?。 | egrep -n 'go?d' filename |
| | 指明两项之间的一个选择(or)。要匹配 |,请使用 \|。 | egrep -n 'gd|good' filename |
() | 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 \( 和 \)。 | egrep -n 'g(la|oo)d filename |
- 匹配形如2018-1-30的日期:
([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})-(((0[13578]|1[02])-(0[1-9]|[12][0-9]|3[01]))|((0[469]|11)-(0[1-9]|[12][0-9]|30))|(02-(0[1-9]|[1][0-9]|2[0-8])))
更多参考: