概述
全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix/Linux 的 grep 家族包括 grep、egrep 和 fgrep,其中 egrep 和 fgrep 的命令跟grep 有细微的区别,egrep 是 grep 的扩展,支持更多的 re 元字符, fgrep 是 fixed grep或 fast grep 简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。
目前 Linux 操作系统默认使用 GNU 版本的 grep。它功能更强,可以通过-G、-E、-F命令行选项来使用 egrep 和 fgrep 的功能。
语法格式及常用参数详解如下:
grep -[acinv] 'word' Filename
Grep 常用参数详解如下:
参数 | 注释 |
---|
-a | 以文本文件方式搜索; |
-c | 计算找到的符合行的次数; |
-i | 忽略大小写; |
-n | 顺便输出行号; |
-v | 反向选择,即显示不包含匹配文本的所有行; |
-h | 查询多文件时不显示文件名; |
-l | 查询多文件时只输出包含匹配字符的文件名; |
-s | 不显示不存在或无匹配文本的错误信息; |
-E | 允许使用 egrep 扩展模式匹配。 |
-A | file 显示查找内容及后多少行 |
-B | file 显示查找内容及前多少行 |
学习 Grep 时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在 Linux 的 Shell 命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在 AWK、GREP、SED、VIM 工具中对文本的操作。
通配符类型详解:
通配符 | 注释 |
---|
* | 0 个或者多个字符、数字; |
? | 匹配任意一个字符; |
# | 表示注解; |
| |
; | 多个命令连续执行; |
& | 后台运行指令; |
! | 逻辑运算非; |
[ ] | 内容范围,匹配括号中内容; |
{ } | 命令块,多个命令匹配。 |
正则表达式详解:
正则 | 注释 |
---|
* | 前一个字符匹配 0 次或多次; |
. | 匹配除了换行符以外任意一个字符; |
.* | 代表任意字符; |
^ | 匹配行首,即以某个字符开头; |
$ | 匹配行尾,即以某个字符结尾; |
(…) | 标记匹配字符; |
[] | 匹配中括号里的任意指定字符,但只匹配一个字符; |
[^] | 匹配除中括号以外的任意一个字符; |
\ | 转义符,取消特殊含义; |
< | 锚定单词的开始; |
> | 锚定单词的结束; |
{n} | 匹配字符出现 n 次; |
{n,} | 匹配字符出现大于等于 n 次; |
{n,m} | 匹配字符至少出现 n 次,最多出现 m 次; |
\w | 匹配文字和数字字符; |
\W | \w 的反置形式,匹配一个或多个非单词字符; |
\b | 单词锁定符; |
\s | 匹配任何空白字符; |
\d | 匹配一个数字字符,等价于[0-9]。 |
常用 GREP 工具企业演练案列:
grep -c "test" jfedu.txt 统计 test 字符总行数;
grep -i "TEST" jfedu.txt 不区分大小写查找 TEST 所有的行;
grep -n "test" jfedu.txt 打印 test 的行及行号;
grep -v "test" jfedu.txt 不打印 test 的行;
grep "test[53]" jfedu.txt 以字符 test 开头,接 5 或者 3 的行;
grep "^[^test]" jfedu.txt 显示输出行首不是 test 的行;
grep "[Mm]ay" jfedu.txt 匹配 M 或 m 开头的行;
grep "K…D" jfedu.txt 匹配 K,三个任意字符,紧接 D 的行;
grep "[A-Z][9]D" jfedu.txt 匹配大写字母,紧跟 9D 的字符行;
grep "T\{2,\}" jfedu.txt 打印字符 T 字符连续出现 2 次以上的行;
grep "T\{4,6\}" jfedu.txt 打印字符 T 字符连续出现 4 次及 6 次的行;
grep -n "^$" jfedu.txt 打印空行的所在的行号;
grep -vE "#|^$" jfedu.txt 不匹配文件中的
grep --color -ra -E "db|config|sql" * 匹配包含 db 或者 config 或者 sql 的文件;
grep --color -E "\<([0-9]{1,3}\.){3}([0-9]{1,3})\>" jfedu.txt 匹配 IPV4地址。