简述
Linux中 grep 命令用于查找文件里符合条件的字符串。
grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
grep命令(Global Regular Expression Print)是 Linux系统中一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来 。
grep 是linux中最为常用的三大文本(awk,sed,grep)处理工具之一,所以有必要掌握其用法。
grep家族总共有三个成员构成:grep、egrep、fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。
语法
grep [选项] 字符串/正则表达式 [文件]
参数说明
-a 或 --text
: 不要忽略二进制的数据。
-A<显示行数> 或 --after-context=<显示行数>
: 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
-b 或 --byte-offset
: 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
-B<显示行数> 或 --before-context=<显示行数>
: 除了显示符合样式的那一行之外,并显示该行之前的内容。
-c 或 --count : 计算符合样式的列数。
-C<显示行数> 或 --context=<显示行数>或-<显示行数>
: 除了显示符合样式的那一行之外,并显示该行之前后的内容。
-d <动作> 或 --directories=<动作>
: 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e<范本样式> 或 --regexp=<范本样式>
: 指定字符串做为查找文件内容的样式。
-E 或 --extended-regexp
: 将样式为延伸的正则表达式来使用。
-f<规则文件> 或 --file=<规则文件>
: 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
-F 或 --fixed-regexp
: 将样式视为固定字符串的列表。
-G 或 --basic-regexp
: 将样式视为普通的表示法来使用。
-h 或 --no-filename
: 在显示符合样式的那一行之前,不标示该行所属的文件名称。
-H 或 --with-filename
: 在显示符合样式的那一行之前,表示该行所属的文件名称。
-i 或 --ignore-case
: 忽略字符大小写的差别。
-l 或 --file-with-matches
: 列出文件内容符合指定的样式的文件名称。
-L 或 --files-without-match
: 列出文件内容不符合指定的样式的文件名称。
-n 或 --line-number
: 在显示符合样式的那一行之前,标示出该行的列数编号。
-o 或 --only-matching
: 只显示匹配PATTERN 部分。
-q 或 --quiet或--silent
: 不显示任何信息。
-r 或 --recursive
: 此参数的效果和指定"-d recurse"参数相同。
-s 或 --no-messages
: 不显示错误信息。
-v 或 --revert-match
: 显示不包含匹配文本的所有行。
-V 或 --version
: 显示版本信息。
-w 或 --word-regexp
: 只显示全字符合的列。
-x --line-regexp
: 只显示全列符合的列。
-y
: 此参数的效果和指定"-i"参数相同。
注意!
一、
单双引号
- 在grep 命令中输入 字符串参数时,用双引号括起来。
例如:grep “good” ./1.txt
这样做有两个原因:
一是防止字符串参数被误解为shell命令;
二是可以用来查找多个单词组成的字符串。如果不用双引号将其括起来,那么单词 “good” 将被误认为是一个文件,查询结果将返回”文件不存在”的错误信息。 - 在使用变量时,也应该使用双引号,例如:grep “$good” ./1.txt,如果不这样,将没有返回结果。
- 在调用模式匹配[正则表达式]时,应使用单引号:grep ‘good.*’ ./1.txt
二、
搜索当前目录
默认情况下,grep 只搜索当前目录,如果此目录下有许多子目录
明确要求搜索子目录:grep -r
忽略子目录:grep -d skip
[root@ljh2020 test]# grep -r "good" ./*
./1.txt:today is a good day
三、
特殊符号
< 和 > 分别标注单词的开始与结尾。
例如:
grep man ./*
会匹配 “Batman”、“manic”、“man"等,
grep '\<man' *
匹配"manic”、“man”,但不匹配 “Batman”,
grep '\<man\>'
只匹配"man",而不是 “Batman”、"manic"等其他的字符串。
'^'
: 指匹配的字符串在行首,
'$'
: 指匹配的字符串在行尾,
正则表达式主要参数:
\
: 忽略正则表达式中特殊字符的原有含义。^
:匹配正则表达式的开始行。$
: 匹配正则表达式的结束行。\<
:从匹配正则表达 式的行开始。\>
:到匹配正则表达式的行结束。[ ]
:单个字符,如[A]即A符合要求 。[ - ]
:范围,如[A-Z],即A、B、C一直到Z都符合要求 。.
:所有的单个字符。*
:所有字符,长度可以为0。
举例
# 在当前目录下所有.txt文件中查找字符串"good"
[root@ljh2020 test]# grep "good" *.txt
1.txt:today is a good day
# 查询1.txt 中 含有 "good" 的行数
[root@ljh2020 test]# grep -c "good" ./1.txt
1
# 输出含有"good" 的行以及行号
[root@ljh2020 test]# grep -n "good" ./1.txt
1:today is a good day
# 查询特殊字符时,诸如 $ . ‘ ” * [ ] ^ | \ + ? 时,未避免转义,需要在前面加 '\'
# 查询含有文件名 test.conf 的行
[root@ljh2020 test]# grep "test\.conf" ./1.txt
test.conf
# 查询目录列表中的 所有目录[文件夹]
[root@ljh2020 test]# ls -l |grep "^d"
drwxr-xr-x 2 root root 4096 May 12 21:06 ljh
# 查询目录列表中的所有文件
[root@ljh2020 test]# ls -l |grep -v "^d"
total 4
-rw-r--r-- 1 root root 30 May 12 21:03 1.txt
-rw-r--r-- 1 root root 0 May 12 17:54 2.txt
-rw-r--r-- 1 root root 0 May 12 17:38 3.bocx