1、grep简介
grep (缩写来自Globally search a Regular Expression and Print)是一种强大的文本搜索工具,它能使用特定模式匹配(包括正则表达式)搜索文本,并默认输出匹配行。Unix的grep家族包括grep、egrep和fgrep。Windows系统下类似命令FINDSTR。
grep用来基于正则去实现行过滤的工具;它有很多衍生命令:
egrep 扩展的grep,即默认使用扩展正则表达式的grep,更高级。
fgrep 专用于文件行过滤的工具。
2、grep的工作原理
grep命令在一个或多个文件中查找某个字符模式,如果这个模式中包含空格,就必须用引号把它括起来。grep命令中,模式可以是一个被引号括起来的字符串,也可以是单个词。位于模式之后的所有单词都被视为文件名。grep将输出发送到屏幕,它不会对输入文件进行任何修改或变化。grep返回的退出状态为0,表示成功。退出状态为1,表示没有找到。如果找不到指定的文件,退出状态为2。
3、grep命令的常用选项
--color=auto 对匹配到的文本着色显示。
-v 显示不被pattern匹配到的行,反向查找。
-V 或--version : 显示版本信息。
-i 忽略字符大小写。
-n 显示匹配的行号,在显示符合样式的那一行之前,标示出该行的列数编号。
-o 仅显示匹配到的字符串,只显示匹配PATTERN 部分。
-q 静默模式,不输出任何信息。
-a 或 --text : 不要忽略二进制的数据。
-A # after, 后#行, 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
-b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号,将可执行文件当文本文件来搜索。
-B # before, 前#行,除了显示符合样式的那一行之外,并显示该行之前的内容。
-c 统计匹配的行数,计算符合样式的列数。
-C # context, 前后各#行,除了显示符合样式的那一行之外,并显示该行之前后的内容。
-d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e 实现多个选项间的逻辑or关系,指定字符串做为查找文件内容的样式。
-E 使用ERE,相当于egrep。
-w 匹配整个单词,只显示全字符合的列。
-f <规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
-F 相当于fgrep,不支持正则表达式, 将样式视为固定字符串的列表。
-h 查询多文件时不显示文件名。
-H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。
-l 查询多文件时只输出包含匹配字符的文件名, 列出文件内容符合指定的样式的文件名称。
-L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。
-s 不显示不存在或无匹配文本的错误信息。
-r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同,递归搜索文件目录。
-x --line-regexp : 只显示全列符合的列。
-y 此参数的效果和指定"-i"参数相同。
-G 或 --basic-regexp : 将样式视为普通的表示法来使用。
4、主要参数
\ 忽略正则表达式中特殊字符的原有含义,转义符
^ 匹配正则表达式的开始行
$ 匹配正则表达式的结束行
^$ 表示空行的意思
\< 从匹配正则表达式的行开始
\> 到匹配正则表达式的行结束
[] 单个字符,如[A]即A符合要求,匹配中括号内的字符,匹配指定范围内的任意单个字符
[^] ^出现在[]内 代表排除“非” 举例:[^0-9] 排除纯数字 [^a-z] 排除纯字母
[ - ] 范围,如[a-z]
? 匹配之前的项1次或0次
. 所有的单个字符
+ 匹配之前的项1次或多次
* 表示有多个字符,长度也可以为0
() 匹配表达式,创建一个用于匹配的子串
.* 代表任意多个字符
\? 匹配0或1次字符
\+ 匹配1或以上字符
环境准备
准备一台Centos6服务器
系统: Centos6.8
内存:1G
cpu: 2核
IP地址: 10.0.0.22
5、举例练习
# 匹配ab之间1到3个任意字符 .和{} 组合限定指定范围的任意字符串
[root@ slave ~]# grep 'a.\{1,3\}b' /etc/passwd
dbus:x:81:81:System message bus:/:/sbin/nologin
[root@ slave ~]#
# 过滤出邮件信息
[root@ slave ~]# grep '\<mail\>' /etc/passwd
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@ slave ~]#
# 输出超级用户信息
[root@ slave ~]# egrep '(ro+t).*\1' /etc/passwd
root:x:0:0:root:/root:/bin/bash
[root@ slave ~]#
# 编辑文件,添加完后wq保存退出。
vim 123.txt
# 添加如下
123
456
789
000
^~`#$
%^%*^(&)_=
;'][[]/.,l'
###
###
fknakkfk
kfaktaktkakwt
# 打印出不以英文字开头的行
[root@ slave ~]# grep '^[^a-zA-Z]' 123.txt
123
456