引言:
在学习Linux中的文件查找时,突然联想到平时用的搜索引擎,在生活中我们想获取什么信息,在google等搜索引擎里面敲入就能列出符合我们条件的相关信息。如果我们不满意搜索结果可以进一步精确我们想查找内容的搜索内容,这在Linux的文件查找中称为精确匹配,但是如果我们虽然知道我们想要的内容,但是找不到特别精确的言辞来形容它因此只能输入描述性内容为搜索条件,这种在Linux的文件查找中可以称为模糊匹配。本文的初衷是希望这篇文章可以解决大家在使用Linux的过程中不至于因为查找某个文件找不到而抓狂。
实验环境CentOS7.2
Linux查找工具
Linux中的查找工具有两个:locate、find
locate:非实时查找,根据索引查找
find:实时查找,遍历所有文件进行条件匹配
locate
locate属于非实时查找,它根据事先构建的索引数据库,匹配文件信息进而定位符合条件的文件。
其需事先构建的索引数据库在/var/lib/mlocate/mlocate.db,索引的构建过程需要遍历整个根文件系统,极其耗费资源,因此其常常在系统较为空闲时进行(通常设置自动执行),也可以进行手动更新数据库命令为:updatedb
locate的工作特性:查找速度快、模糊查找、非实时查找
命令使用格式
locate [option]...PATTEN...
-b:只匹配路径中的基名
-c:统计出共有多少个符合条件的文件
-r:BRE(基本正则表达式)
上面演示了locate的三种选项的简单用法
find
find属于实时查找工具,通过遍历指定起始路径下文件系统层级结构完成文件查找。
它的工作特性:查找速度略慢、精确查找、实时查找。
find [OPTION]... [查找路径] [查找条件] [处理动作]
查找路径:指定具体目标路径;默认为当前目录
查找条件:指定的查找标准,可以文件名、大小、类型、权限等标准进行;默认为找出指定路径下的所有文件
处理动作:对符合条件的文件做操作,默认输出至屏幕
………………………………………………………………………………………………………………………
查找条件:
表达式:选项和测试(常为布尔型)
………………………………………………………………………………………………………………………
根据文件名和inode查找:
-name "文件名称":支持使用glob
*, ?, [], [^]
-iname"文件名称":不区分字母大小写
-inumn 按inode号查找
-regex "PATTERN":基于正则表达式模式查找文件,匹配的是整个路径而非其名
示例:查找包含有字符串“what”的文件
………………………………………………………………………………………………………………………
根据属主、属组查找:
-user USERNAME:查找属主为指定用户(UID)的文件
-group GRPNAME: 查找属组为指定组(GID)的文件
-uidUserID:查找属主为指定的UID号的文件
-gidGroupID:查找属组为指定的GID号的文件
-nouser:查找没有属主的文件
-nogroup:查找没有属组的文件
示例:查看/下属于用户fedore的文件,或没有属主的文件
………………………………………………………………………………………………………………………
根据文件类型查找:
-type TYPE:
f: 普通文件
d: 目录文件
l: 符号链接文件
s:套接字文件
b: 块设备文件
c: 字符设备文件
p: 管道文件
示例:查找/test下的普通文件
………………………………………………………………………………………………………………………
组合条件:
与:-a
或:-o
非:-not, !
示例:查找/tmp下属于root且文件类型为普通文件的文件
………………………………………………………………………………………………………………………
根据文件大小来查找:
-size [+|-]#UNIT
常用单位:k, M, G
#UNIT: (#-1, #]
如:6k 表示(5k,6k]
-#UNIT:[0,#-1]
如:-6k 表示[0,5k]
+#UNIT:(#,∞)
如:+6k 表示(6k,∞)
示例:查找/etc下大于1M的文件
………………………………………………………………………………………………………………………
根据时间戳:
以“天”为单位;
-atime[+|-]#,
#: [#,#+1)
+#: [#+1,∞]
-#: [0,#)
-mtime
-ctime
以“分钟”为单位:
-amin
-mmin
-cmin
示例:查找/etc文件夹下2天内被访问过的文件
………………………………………………………………………………………………………………………
根据权限查找:
-perm [/|-]MODE
MODE: 精确权限匹配
/MODE:任何一类(u,g,o)对象的权限中只要能一位匹配即可,或关系,
“-perm +mode”从CentOS7后被“-perm /mode”格式替代
-MODE:每一类对象都必须同时拥有指定权限,与关系
示例:查找/tmp下至少有一类对象有写权限的文件
………………………………………………………………………………………………………………………
处理动作:
-print:默认的处理动作,显示至屏幕;
-ls:类似于对查找到的文件执行“ls -l”命令
-delete:删除查找到的文件;
-fls /PATH/TO/SOMEFILE:查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令;
对于每个文件执行命令之前,都会交互式要求用户确认
-exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令
find传递查找到的文件路径至后面的命令时,是先查找出所有符合条件的文件路径,并一次性传递给后面的命令;但是有些命令不能接受过长的参数,此时命令执行可能会失败,下面方式可规避此问题
find | xargs COMMAND
示例:1)查找/test下名为scrip2的文件,并用cat查看其内容,使用两种方式;2)将搜索到的scrip2文件的长格式信息保存在/test/scrip1中
2)将搜索到的scrip2文件的长格式信息保存在/test/scrip1中
locate与find的不同
locate由于非实时因此会查找到最近删除的文件,而find则不会。上述的不同导致查找的结果有所不同。
示例:在/test/文件下有两个文件scrip1、scrip2,删除scrip1,然后在搜scrip1
先查看下该索引数据库的最新改动时间,该时间是上午的,所以现在我们删除scrip1文件后locate是可以搜到的。
删除scrip1,然后搜索它
比较结束。通过结果,如果我们要求搜索结果靠谱最好还是使用find。
为了对find有更深的了解下面举了关于find的8个例子
1、查找/var目录下属主为root,且属组为mail的所有文件
2、查找/var目录下不属于root、fedore、mail的所有文件
3、查找/var目录下最近一周内其内容修改过,同时属主不为root,也不是postfix的文件
4、查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件
5、查找/etc目录下大于1M且类型为普通文件的所有文件
6、查找/etc目录下所有用户都没有写权限的文件
7、查找/etc目录下至少有一类用户没有执行权限的文件
8、查找/etc/init.d目录下,所有用户都有执行权限,且其它用户有写权限的文件