一、grep:
grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
格式: grep [选项]… 查找条件 目标文件
-i 默认,忽略大小写
-n 显示匹配的行号
-c 只统计匹配的行数
-v 取反,显示搜索之外
-m 多个匹配,可以限定显示的行数
-o 仅显示匹配到的字符串
-A 后跟数字,表示匹配到内容行后,在向下显示几行
-B 后跟数字,表示匹配到内容行后,再向上显示几行
-C 后跟数字,表示匹配到内容行后,在现实上下几行
-e 逻辑“或”,可以匹配多个条件,实现多个选项间的逻辑关系,可以跟多个条件
-w 表示匹配整个单词
-E 表示使用扩展正则表达式,egrep,也可以使用扩展正则表达式
-f 对2个文件内容进行匹配,打印匹配出2个文件相同的内容
-r 递归目录,不处理软连接
-R 递归目录,处理软连接
示例:
二、正则表达式:
REGEXP: Regular Expressions,由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能,类似于增强版的通配符功能,但与通配符不同,通配符功能是用来处理文件名,而正则表达式是处理文本内容中字符。
正则表达式被很多程序和开发语言所广泛支持:vim, less,grep,sed,awk, nginx,mysql 等
主要用来匹配字符串(命令结果,文本内容),
通配符匹配文件(而且是已存在的文件)
-
基本正则表达式
-
扩展正则表达式
1.元字符:
. | 匹配任意单个字符,可以是一个汉字 |
[ ] | 匹配指定范围内的任意单个字符 |
[^] | 匹配指定范围外的任意单个字符 |
[:alnum:] | 字母和数字 |
[:alpha:] | 代表任何英文大小写字符,相当于 A-Z, a-z |
[:lower:] | 小写字母 |
[:upper:] | 大写字母 |
[:blank:] | 空白字符 |
[:space:] | 包括空格、制表符(水平和垂直)、换行符、回车符等各种类型的空白 |
[:graph:] | 可打印的非空白字符 |
[:print:] | 可打印字符 |
[:punct:] | 标点符号 |
\w | 匹配单词构成部分,等价于[_[:alnum:]] |
\W | 匹配非单词构成部分,等价于[^_[:alnum:]] |
\S | 匹配任何非空白字符。 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等 |
例:
ls /etc/ | grep "rc[.0-6]"
#表示匹配以rc开头,任意单个字符,0-6的数字
2.表示次数:
* | 匹配前面的字符任意次,包括0次 |
.* | 任意长度的任意字符,不包括0次 |
\? | 匹配其前面的字符出现0次或1次,即:可有可无 |
\+ | 匹配其前面的字符出现最少1次,即:肯定有且 >=1 次 |
\{n\} | 匹配前面的字符n次 |
\{m,n\} | 匹配前面的字符至少m次,至多n次 |
\{,n\} | 匹配前面的字符至多n次,<=n |
\{n,\} | 匹配前面的字符至少n次 |
3.位置锚定:
^ | |
$ | |
^root$ | |
^$ | |
^[[:space:]]*$ | |
\broot | 词首锚定,用于单词模式的左侧 (连续的数字,字母,下划线都算单词内部) |
123\b | 词尾锚定,用于单词模式的右侧 |
\<PATTERN\> | 匹配整个单词 |
4.分组:
分组:() 将多个字符捆绑在一起,当作一个整体处理,如:(root)+
\ | 表示或者
5.扩展正则表达式:
* 匹配前面的字符任意次,0次也可以,有多少匹配多少。贪婪模式
.* 匹配任意长度的字符,至少一次,不包括0次
? 匹配前面的字符0次或者1次,可有可无
+ 匹配前面的字符,至少1次
{n} 匹配前面的字符,只能匹配n次
{m,n} 匹配前面的字符,最多匹配n次,最少匹配m次
{,n} 匹配前面的字符,最多n次
{n,} 匹配前面的字符,最少n次