这里说下正则表达式基本的应用:
• 匹配行首与行尾。
• 匹配数据集。
• 只匹配字母和数字。
• 匹配一定范围内的字符串集。
^ | 只匹配行首 |
$ | 只匹配行尾 |
* | 一个单字符后紧跟*,匹配0个或多个此单字符 |
[] | 匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345] |
\ | 用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。 |
. | 匹配任意单字符 |
pattern\{n\} | 用来匹配前面pattern出现次数。n为次数 |
pattern\{n,\} | 含义同上,但次数最少为n |
patter\{n,m\} | 含义同上,但pattern出现次数在n与m之间 |
句点“.”可以匹配任意单字符。“.”可以匹配字符串头,也可以是中间任意字符。
如t. ,可以匹配test,也可以匹配tmp.
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep t.
-rwxrwxr-x 1 karry karry 50 9月 12 17:35 test1
-rwxr--r-- 1 karry karry 91 9月 12 17:45 test2
-rwxr--r-- 1 karry karry 127 9月 12 17:54 test3
drwxrwxr-x 2 karry karry 4096 9月 12 17:54 tmp
在ls-l命令中,可以匹配一定权限:
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep ..x..x..x
drwxr-xr-x 3 karry karry 4096 9月 12 17:54 .
drwxrwxr-x 4 karry karry 4096 9月 12 17:33 ..
-rwxrwxr-x 1 karry karry 50 9月 12 17:35 test1
drwxrwxr-x 2 karry karry 4096 9月 12 17:54 tmp
2. 在行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。例如,使用ls-l命令,并匹配目录。之所以可以
这样做是因为ls-l命令结果每行第一个字符是d,即代表一个目录。
karry@karry-Vostro-230:~/Util/shell$ ls -al |grep ^d
drwxr-xr-x 3 karry karry 4096 9月 12 17:54 .
drwxrwxr-x 4 karry karry 4096 9月 12 17:33 ..
drwxrwxr-x 2 karry karry 4096 9月 12 17:54 tmp
3.在行尾以$匹配字符串或字符
可以说$与^正相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。
karry@karry-Vostro-230:~/Util/shell$ ls -al|grep [0-9]$
总用量 24
-rwxrwxr-x 1 karry karry 50 9月 12 17:35 test1
-rwxr--r-- 1 karry karry 91 9月 12 17:45 test2
-rwxr--r-- 1 karry karry 127 9月 12 17:54 test3
4.使用*匹配字符串中的单字符或其重复序列
使用此特殊字符匹配任意字符或字符串的重复多次表达式。
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep t*t
-rwxrwxr-x 1 karry karry 50 9月 12 17:35 test1
-rwxr--r-- 1 karry karry 91 9月 12 17:45 test2
-rwxr--r-- 1 karry karry 127 9月 12 17:54 test3
drwxrwxr-x 2 karry karry 4096 9月 12 17:54 tmp
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep t*
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep *p
drwxrwxr-x 2 karry karry 4096 9月 12 17:54 tmp
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep *1
-rwxrwxr-x 1 karry karry 50 9月 12 17:35 test1
karry@karry-Vostro-230:~/Util/shell$ ls -al | grep *[0-9]
5.使用\屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。
下列字符可以认为是特殊字符:
$ . ' " * [ ] ^ | { } \ + ?
6. 使用[]匹配一个范围或集合
使用[]匹配特定字符串或字符串集.
使用“-”表示一个字符串范围,表明字符串范围从“-”左边字符开始,到“-”右边字
符结束。
如果熟知一个字符串匹配操作,应经常使用[]模式。
假定要匹配任意一个数字,可以使用:
[0123456789]
然而,通过使用“-”符号可以简化操作:
[0-9]
或任意小写字母
[a-z]
要匹配任意字母,则使用:
[A-Za-z]
表明从A-Z、a-z的字母范围。
如要匹配任意字母或数字,模式如下:
[A-Za-z0-9]
注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符,而
[^0-9]
匹配任一非数字型字符。
7. 使用\{\}匹配模式结果出现的次数
使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用\{ \ },此模式有三种
形式,即:
pattern\{n\}匹配模式出现n次。
pattern\{n,\}匹配模式出现最少n次。
pattern\{n,m}匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数。
测试test.txt,内容如下:
988
451
123321
110
911
hello
abc
karry@karry-Vostro-230:~/Util/shell$ cat test.txt|grep '^[0-9]\{1,3\}'
988
451
123321
110
911
karry@karry-Vostro-230:~/Util/shell$ cat test.txt|grep 'l\{2\}'
hello