Linux中强大且常用命令:find、grep

Linux中强大且常用命令:find、grep

2017-03-16吴秦(Tyler) 程序猿 程序猿

来源:吴秦(Tyler)

链接:www.cnblogs.com/skynet/archive/2010/12/25/1916873.html(点击尾部阅读原文前往)


在linux下面工作,有些命令能够大大提高效率。本文就向大家介绍find、grep命令,他哥俩可以算是必会的linux命令,我几乎每天都要用到他们。本文结构如下:


  • find命令

    • find命令的一般形式

    • find命令的常用选项及实例

    • find与xargs


  • grep命令

    • grep命令的一般形式

    • grep正则表达式元字符集(基本集)

    • grep命令的常用选项及实例

1、find命令


find命令是一个无处不在命令,是linux中最有用的命令之一。find命令用于:在一个目录(及子目录)中搜索文件,你可以指定一些匹配条件,如按文件名、文件类型、用户甚至是时间戳查找文件。下面就通过实例来体验下find命令的强大。


1.1、find命令的一般形式


man文档中给出的find命令的一般形式为:


find [-H] [-L] [-P] [-D debugopts] [-Olevel] [path…] [expression]


其实[-H] [-L] [-P] [-D debugopts] [-Olevel]这几个选项并不常用(至少在我的日常工作中,没有用到过),上面的find命令的常用形式可以简化为:


find [path…] [expression]


  • path:find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录


  • expression:expression可以分为——“-options [-print -exec -ok …]”


  • -options,指定find命令的常用选项,下节详细介绍


  • -print,find命令将匹配的文件输出到标准输出


  • -exec,find命令对匹配的文件执行该参数所给出的shell命令。相应命令的形式为’command’ {  } ;,注意{   }和;之间的空格
    find ./ -size 0 -exec rm {} ; 删除文件大小为零的文件 (还可以以这样做:rm -i find ./ -size 0  或 find ./ -size 0 | xargs rm -f &)
    为了用ls -l命令列出所匹配到的文件,可以把ls -l命令放在find命令的-exec选项中:find . -type f -exec ls -l {  } ;
    在/logs目录中查找更改时间在5日以前的文件并删除它们:find /logs -type f -mtime +5 -exec rm {  } ;


  • -ok,和-exec的作用相同,只不过以一种更为安全的模式来执行该参数所给出的shell命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。
    find . -name “*.conf”  -mtime +5 -ok rm {  } ; 在当前目录中查找所有文件名以.LOG结尾、更改时间在5日以上的文件,并删除它们,只不过在删除之前先给出提示

也有人这样总结find命令的结构:


find start_directory test

options

criteria_to_match

action_to_perform_on_results


1.2、find命令的常用选项及实例


  • -name
    按照文件名查找文件。
    find /dir -name filename  在/dir目录及其子目录下面查找名字为filename的文件
    find . -name “*.c” 在当前目录及其子目录(用“.”表示)中查找任何扩展名为“c”的文件


  • -perm
    按照文件权限来查找文件。
    find . -perm 755 –print 在当前目录下查找文件权限位为755的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件


  • -prune
    使用这一选项可以使find命令不在当前指定的目录中查找,如果同时使用-depth选项,那么-prune将被find命令忽略。
    find /apps -path “/apps/bin” -prune -o –print 在/apps目录下查找文件,但不希望在/apps/bin目录下查找
    find /usr/sam -path “/usr/sam/dir1” -prune -o –print 在/usr/sam目录下查找不在dir1子目录之内的所有文件


  • -user
    按照文件属主来查找文件。
    find ~ -user sam –print 在$HOME目录中查找文件属主为sam的文件


  • -group
    按照文件所属的组来查找文件。
    find /apps -group gem –print 在/apps目录下查找属于gem用户组的文件


  • -mtime -n +n
    按照文件的更改时间来查找文件, – n表示文件更改时间距现在n天以内,+ n表示文件更改时间距现在n天以前。
    find / -mtime -5 –print 在系统根目录下查找更改时间在5日以内的文件
    find /var/adm -mtime +3 –print 在/var/adm目录下查找更改时间在3日以前的文件


  • -nogroup
    查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在。
    find / –nogroup -print


  • -nouser
    查找无有效属主的文件,即该文件的属主在/etc/passwd中不存在。
    find /home -nouser –print


  • -newer file1 ! file2
    查找更改时间比文件file1新但比文件file2旧的文件。


  • -type
    查找某一类型的文件,诸如:
    b – 块设备文件。
    d – 目录。
    c – 字符设备文件。
    p – 管道文件。
    l – 符号链接文件。
    f – 普通文件。
    find /etc -type d –print 在/etc目录下查找所有的目录
    find . ! -type d –print 在当前目录下查找除目录以外的所有类型的文件
    find /etc -type l –print 在/etc目录下查找所有的符号链接文件


  • -size n:[c] 查找文件长度为n块的文件,带有c时表示文件长度以字节计。
    find . -size +1000000c –print 在当前目录下查找文件长度大于1 M字节的文件
    find /home/apache -size 100c –print 在/home/apache目录下查找文件长度恰好为100字节的文件
    find . -size +10 –print 在当前目录下查找长度超过10块的文件(一块等于512字节)


  • -depth:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
    find / -name “CON.FILE” -depth –print 它将首先匹配所有的文件然后再进入子目录中查找


  • -mount:在查找文件时不跨越文件系统mount点。
    find . -name “*.XC” -mount –print 从当前目录开始查找位于本文件系统中文件名以XC结尾的文件(不进入其他文件系统)


  • -follow:如果find命令遇到符号链接文件,就跟踪至链接所指向的文件。

1.3、find与xargs


在使用find命令的-exec选项处理匹配到的文件时, find命令将所有匹配到的文件一起传递给exec执行。但有些系统对能够传递给exec的命令长度有限制,这样在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs命令的用处所在,特别是与find命令一起使用。


find命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像-exec选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。


在有些系统中,使用-exec选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高;


而使用xargs命令则只有一个进程。另外,在使用xargs命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。


来看看xargs命令是如何同find命令一起使用的,并给出一些例子。


find . -type f -print | xargs file 查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件


find / -name “core” -print | xargs echo “” >/tmp/core.log 在整个系统中查找内存信息转储文件(core dump) ,然后把结果保存到/tmp/core.log 文件中:


find . -type f -print | xargs grep “hostname” 用grep命令在所有的普通文件中搜索hostname这个词


find ./ -mtime +3 -print|xargs rm -f –r 删除3天以前的所有东西 (find . -ctime +3 -exec rm -rf {} ;)


find ./ -size 0 | xargs rm -f & 删除文件大小为零的文件


find命令配合使用exec和xargs可以使用户对所匹配到的文件执行几乎所有的命令。


2、grep命令


grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。


2.1、grep命令的一般选项及实例


grep [OPTIONS] PATTERN [FILE…]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]


grep命令用于搜索由Pattern参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用ed或egrep命令样式。如果在File参数中指定了多个名称,grep命令将显示包含匹配行的文件的名称。对 shell 有特殊含义的字符 ($, *, [, |, ^, (, ), ) 出现在 Pattern参数中时必须带双引号。


如果 Pattern参数不是简单字符串,通常必须用单引号将整个模式括起来。在诸如 [a-z], 之类的表达式中,-(减号)cml 可根据当前正在整理的序列来指定一个范围。整理序列可以定义等价的类以供在字符范围中使用。如果未指定任何文件,grep会假定为标准输入。


2.2、grep正则表达式元字符集(基本集)


^  锚定行的开始 如:’^grep’匹配所有以grep开头的行。


$  锚定行的结束 如:’grep$’匹配所有以grep结尾的行。


.   匹配一个非换行符的字符 如:’gr.p’匹配gr后接一个任意字符,然后是p。


*  匹配零个或多个先前字符 如:’ *grep’匹配所有一个或多个空格后紧跟grep的行。 .*一起用代表任意字符。


[] 匹配一个指定范围内的字符,如'[Gg]rep’匹配Grep和grep。


[^]  匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep’匹配不包含A-F和H-Z的一个字母开头,紧跟rep的行。


(..)  标记匹配字符,如:'(love)’,love被标记为1。


>  锚定单词的结束,如’grep>’匹配包含以grep结尾的单词的行。


x{m} 连续重复字符x,m次,如:’o{5}’匹配包含连续5个o的行。


x{m,} 连续重复字符x,至少m次,如:’o{5,}’匹配至少连续有5个o的行。


x{m,n} 连续重复字符x,至少m次,不多于n次,如:’o{5,10}’匹配连续5–10个o的行。


w  匹配一个文字和数字字符,也就是[A-Za-z0-9],如:’Gw*p’匹配以G后跟零个或多个文字或数字字符,然后是p。


W  w的反置形式,匹配一个非单词字符,如点号句号等。W*则可匹配多个。


b  单词锁定符,如: ‘bgrepb’只匹配grep,即只能是grep这个单词,两边均为空格。


2.3、grep命令的常用选项及实例


-?

同时显示匹配行上下的?行,如:grep -2 pattern filename同时显示匹配行的上下2行。


-b,–byte-offset

打印匹配行前面打印该行所在的块号码。


-c,–count

只打印匹配的行数,不显示匹配的内容。


-f File,–file=File

从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。


-h,–no-filename

当搜索多个文件时,不显示匹配文件名前缀。


-i,–ignore-case

忽略大小写差别。


-q,–quiet

取消显示,只返回退出状态。0则表示找到了匹配的行。


-l,–files-with-matches

打印匹配模板的文件清单。


-L,–files-without-match

打印不匹配模板的文件清单。


-n,–line-number

在匹配的行前面打印行号。


-s,–silent

不显示关于不存在或者无法读取文件的错误信息。


-v,–revert-match

反检索,只显示不匹配的行。


-w,–word-regexp

如果被引用,就把表达式做为一个单词搜索。


-V,–version

显示软件版本信息。


=====


ls -l | grep ‘^a’ 通过管道过滤ls -l输出的内容,只显示以a开头的行。


grep ‘test’ d* 显示所有以d开头的文件中包含test的行。


grep ‘test’ aa bb cc 显示在aa,bb,cc文件中匹配test的行。


grep ‘[a-z]’ aa 显示所有包含每个字符串至少有5个连续小写字符的字符串的行。


grep ‘w(es)t.*’ aa 如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(),找到就显示该行。如果用egrep或grep -E,就不用””号进行转义,直接写成’w(es)t.*’就可以了。


grep -i pattern files :不区分大小写地搜索。默认情况区分大小写


grep -l pattern files :只列出匹配的文件名,


grep -L pattern files :列出不匹配的文件名,


grep -w pattern files :只匹配整个单词,而不是字符串的一部分(如匹配‘magic’,而不是‘magical’),


grep -C number pattern files :匹配的上下文分别显示[number]行,


grep pattern1 | pattern2 files :显示匹配 pattern1 或 pattern2 的行,


grep pattern1 files | grep pattern2 :显示既匹配 pattern1 又匹配 pattern2 的行。


参考文献:


  • 关于Linux Grep命令使用的详细介绍,http://fanqiang.chinaunix.net/system/linux/2007-03-15/5110.shtml

  • Linux文件查找命令find,xargs详述,http://www.linuxsir.org/main/?q=node/137#1.1

  • man文档(man find、man grep)


相关阅读:《find命令详解


find命令是我们日常工作中比较常用的Linux命令。全面的掌握这个命令可以使很多操作达到事半功倍的效果。如果对find命令有以下这些疑惑,本文都能帮你解决:

1、find命令的格式是什么?

2、参数中出现+或-号是什么意思?比如find / -mtime +7与find / -mtime -7什么区别?

3、find /etc/ -name “passwd” -exec echo {} \;和find /etc/ -name “passwd” -exec echo {} +有啥区别?

4、-exec参数为什么要以“\;”结尾,而不是只写“;”?

命令基础

find命令大家都比较熟悉,反倒想讲的有特色比较困难。那干脆我们怎么平淡怎么来好了。我们一般用的find命令格式很简单,一般分成三个部分:

find /etc -name "passwd"

格式如上,第一段find命令。第二段,要搜索的路径。这一段目录可以写多个,如:

find /etc /var /usr -name "passwd"

第三段,表达式。我们例子中用的是-name “passwd”这个表达式,指定条件为找到文件名是passwd的文件。对于find命令,最需要学习的是表达式这一段。表达式决定了我们要找的文件是什么属性的文件,还可以指定一些“动作”,比如将匹配某种条件的文件删除。所以,find命令的核心就是表达式(EXPRESSION)的指定方法。

find命令中的表达式有四种类型,分别是:

1、Tests:就是我们最常用的指定查找文件的条件。

2、Actions:对找到的文件可以做的操作。

3、Global options:全局属性用来限制一些查找的条件,比如常见的目录层次深度的限制。

4、Positional options:位置属性用来指定一些查找的位置条件。


这其中最重要的就是Tests和Actions,他们是find命令的核心。另外还有可以将多个表达式连接起来的操作符,他们可以表达多个表达式之间的逻辑关系和运算优先顺序,叫做Operators。

下面我们就来分类看一下这些个分类的功能。

TESTS

find命令是通过文件属性查找文件的。所以,find表达式的tests都是文件的属性条件,比如文件的各种时间,文件权限等。很多参数中会出现指定一个数字n,一般会出现三种写法:

+n:表示大于n。

-n:表示小于n。

n:表示等于n。

根据时间查找

比较常用数字方式来指定的参数是针对时间的查找,比如-mtime n:查找文件修改时间,单位是天,就是n*24小时。举个例子说:

[root@zorrozou-pc0 zorro]# find / -mtime 7 -ls

我们为了方便看到结果,在这个命令中使用了-ls参数,具体细节后面会详细解释。再此我们只需要知道这个参数可以将符合条件的文件的相关属性显示出来即可。那么我们就可以通过这个命令看到查找到的文件的修改时间了。

[root@zorrozou-pc0 zorro]# find / -mtime 7 -ls|head   524295      4 drwxr-xr-x  12  root     root         4096 6月  8 13:43 /root/.config   524423      4 drwxr-xr-x   2  root     root         4096 6月  8 13:43 /root/.config/yelp   524299      4 drwxr-xr-x   2  root     root         4096 6月  8 13:23 /root/.config/dconf   524427      4 -rw-r--r--   1  root     root         3040 6月  8 13:23 /root/.config/dconf/user ...

我们会发现,时间都集中在6月8号,而今天是:

[root@zorrozou-pc0 zorro]# date 2016年 06月 15日 星期三 14:30:09 CST

实际上,当我们在mtime后面指定的是7的时候,实际上是找到了距离现在7个24小时之前修改过的文件。如果我们在考究一下细节的话,可以使用这个命令再将找到的文件用时间排下顺序:

[root@zorrozou-pc0 zorro]# find / -mtime 7 -exec ls -tld {} \+

此命令用到了exec参数,后面会详细说明。我们会发现,找到的文件实际上是集中在6月7日的14:30到6月8日的14:30这个范围内的。就是说,实际上,指定7天的意思是说,找到文件修改时间范围属于距离当前时间7个24小时到8个24小时之间的文件,这是不加任何+-符号的7的含义。如果是-mtime -7呢?

[root@zorrozou-pc0 zorro]# find / -mtime -7 -exec ls -tld {} \+

你会发现找到的文件是从现在开始到7个24小时范围内的文件。但是不包括7个24小时到8个24小时的时间范围。那么-mtime +7也应该好理解了。这就是find指定时间的含义。类似的参数还有:

-ctime:以天为单位通过change time查找文件。

-atime:以天为单位通过access time查找文件。

-mmin:以分钟为单位通过modify time查找文件。

-amin:以分钟为单位通过access time查找文件。

-cmin:以分钟单位通过change time查找文件。

这些参数都是指定一个时间数字n,数字的意义跟mtime完全一样,只是时间的单位和查找的时间不一样。

除了指定时间以外,find还可以通过对比某一个文件的相关时间找到符合条件的文件,比如-anewer file。

[root@zorrozou-pc0 zorro]# find /etc -anewer /etc/passwd

这样可以在/etc/目录下找到文件的access time比/etc/passwd的access time更新的所有文件。类似的参数还有:

-cnewer:比较文件的change time。

-newer:比较文件的modify time。

-newer还有一种特殊用法,可以用来做各种时间之间的比较。比如,我想找到文件修改时间比/etc/passwd文件的change time更新的文件:

[root@zorrozou-pc0 zorro]# find /etc/ -newermc /etc/passwd

这个用法的原型是:find /etc/ -newerXY file。其中Y表示的是跟后面file的什么时间比较,而X表示使用查找文件什么时间进行比较。-newermc就是拿文件的modify time时间跟file的change time进行比较。X和Y可以使用的字母为:

a:文件access time。
c:文件change time。
m:文件modify time。

在某些支持记录文件的创建时间的文件系统上,可以使用B来表示文件创建时间。ext系列文件系统并不支持记录这个时间。

根据用户查找

-uid n:文件的所属用户uid为n。

-user name:文件的所属用户为name。

-gid n:文件的所属组gid为n。

-group name:所属组为name的文件。

-nogroup:没有所属组的文件。

-nouser:没有所属用户的文件。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值