1. 正则表达式与通配符
- 正则表达式。用来在文件中匹配符合条件的字符串,是包含匹配。 grep、awk、sed等命令可以支持正则表达式。
- 通配符。用来匹配符合条件的文件名,是完全匹配。ls、find、cp等命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配。
在Linux的shell中,通配符是用来完全匹配文件名的,而正则表达式是用来包含匹配文件中的字符串的。二者有明显的区别。
2. 基础正则表达式
在Linux中,正则表达式主要由元字符和限定符组成。
元字符用来指定匹配的位置或者匹配什么字符。
限定符用来指定匹配的个数(次数),或者说,字符出现的次数。
常用的元字符,如下表:
元字符 | 说明 |
---|---|
. | 匹配除了换行符之外的任意一个字符。 |
^ | 匹配行首。 |
$ | 匹配行尾。 |
[] | 匹配中括号内的任意一个字符。如:[abc]或[a-zA-Z0-9]。 |
[^] | 匹配除了中括号内的任意一个字符。如:[^0-9]。 |
\ | 转义符。用于取消某些符号的特殊含义。如: . 表示匹配字符 . 本身。 |
限定符:限定了匹配字符的次数。如果没有指定限定符,则表示匹配1次。
常用的限定符,如下表:
限定符 | 说明 |
---|---|
* | 表示其前面的字符出现0次或任意次。 |
{n} | 表示其前面的字符恰好出现n次。如:[0-9]{4} 匹配4位数字。 |
{n,} | 表示其前面的字符出现n次及以上。 |
{n,m} | 表示其前面的字符出现n到m次。如:[a-z]{3,5} 匹配3到5位小写字母。 |
示例:
grep "a" a.txt
显示a.txt中包含字母a的行。
grep "a*" a.txt
显示a.txt中所有内容,包括空白行。
grep "aa*" a.txt
显示a.txt中包含字母a的行。
grep "aba*" a.txt
显示a.txt中包含字母ab的行。
grep "s..d*" a.txt
显示在s和d这两个字母之间一定有两个字符的单词。
grep "s.*d" a.txt
显示在s和d这之间有任意字符的。
grep ".*" a.txt
显示所有内容。
grep "^3" a.txt
显示a.txt中以数字3开头的行。
grep "^M" a.txt
显示a.txt中以大写M开头的行。
grep -n "^$" a.txt
显示a.txt中的空白行,并显示行号。
grep "[0-9]" a.txt
显示a.txt中包含数字的行。
grep "^[0-9]" a.txt
显示a.txt中以数字开头的行。
grep "[0-9]$" a.txt
显示a.txt中以数字结尾的行。
grep "^[^a-z]" a.txt
显示不用小写字母开头的行。
grep "^[^a-zA-Z]" a.txt
显示不用字母开头的行。
grep "b\{3\}" a.txt
显示a.txt中包含bbb的行。
同命令 grep "bbb" a.txt
grep "\.$" a.txt
显示a.txt中以.结尾的行。