如何使用find和xargs查找和处理文件

  • 查找文件

find 至少要加上查找的路径。例如,此命令将查找(并打印)系统上的每个文件:

find /

由于一切皆文件,因此你会看到大量的输出。这可能无法帮助你找到所需的内容。你可以更改路径参数缩小范围,但这实际上并没有比使用 ls 命令更好。因此,你需要考虑要查找的内容。
也许你想在家目录中查找所有 JPEG 文件。 -name 参数允许你将结果限制为与给定模式匹配的文件。

find ~ -name '*jpg'

但是等等!如果其中一些扩展名是大写怎么办? -iname 类似于 -name,但不区分大小写:

find ~ -iname '*jpg'

很好!但是 8.3 命名方案出自 1985 年。某些图片的扩展名可能是 .jpeg。幸运的是,我们可以将模式使用“或”(-o)进行组合。括号需要转义,以便使 find 命令而不是 shell 程序尝试解释它们。

find ~ \( -iname 'jpeg' -o -iname 'jpg' \)

更进一步。如果你有一些以 jpg 结尾的目录怎么办?(我不懂你为什么将目录命名为 bucketofjpg 而不是 pictures?)我们可以加上 -type 参数来仅查找文件:

find ~ \( -iname '*jpeg' -o -iname '*jpg' \) -type f

或者,也许你想找到那些名字奇怪的目录,以便之后可以重命名它们:

find ~ \( -iname '*jpeg' -o -iname '*jpg' \) -type d

最近你拍摄了很多照片,因此使用 -mtime(修改时间)将范围缩小到最近一周修改过的文件。 -7 表示 7 天或更短时间内修改的所有文件。

find ~ \( -iname '*jpeg' -o -iname '*jpg' \) -type f -mtime -7
  • find的其他常见使用方法
查找当前目录下的可执行文件
find . -type f -executable
其他类似参数
-readable:文件可读。 
-writable:文件可写。

查找当前目录下u为 “指定权限(精确匹配)” 的文件或目录
find . -perm 700 -ls
等价命令
find . -perm u=rwx -ls

查找当前目录下 “包含读 ‘和’ 写” 权限的文件
find . -type f -perm -600 | xargs ls -l

查找当前目录下 “包含读 ‘或’ 写” 权限的文件
find . -type f -perm /600 | xargs ls -l

对于特殊权限,查找当前目录下包含SUID的文件
find . -perm -4000 | xargs ls -l

按文件名进行查找
-name filename:查找文件名为filename的文件。注意如果filename中包括*等特殊符号的时候,需要加引号。 
-iname:-name的忽略大小写版本。 
-lname filename:查找符号连接文件名为filename的文件。 
-ilname:lname的忽略大小写版本。 

在/目录下查找路径以/u开头并且以SS结尾的文件
find / -path "/u*SS"
-ipath:path的忽略大小写版本

其他查找参数:
-regex pattern:用正则表达式匹配文件名。 
-iregex:regex的忽略大小写版本。 
-empty:文件为空而且是一个普通文件或者目录。 
-size n[cwbkMG]:指定文件长度查找文件。单位选择位: 
1 . c:字节单位。 
2 . b:块为单位,块大小为512字节,这个是默认单位。 
3 . w:以words为单位,words表示两个字节。 
4 . k:以1024字节为单位。 
5 . M:以1048576字节为单位。 
6 . G:以1073741824字节为单位。
n的数字指定也可以使用 + - 号作为前缀,表示找到小于(-)指定长度的文件或者大于(+)指定长度的文件。

-type c:以文件类型查找文件: 
c可以选择的类型为: 
1 . b:块设备。 
2 . c:字符设备。 
3 . d:目录。 
4 . p:命名管道。 
5 . f:普通文件。 
6 . l:符号连接。 
7 . s:socket。

根据用户、组查找
-uid n:文件的所属用户uid为n。 
-user name:文件的所属用户为name。 
-gid n:文件的所属组gid为n。 
-group name:所属组为name的文件。 
-nogroup:没有所属组的文件。 
-nouser:没有所属用户的文件。

查找/var下一周内访问过的无属主无属组的文件,并列出
find /var -type f -atime -7 \( -nouser -o -nogroup \) -ls

按照时间进行查找
-amin:以分钟为单位通过文件的最后存取时间(access time)查找文件。 
-cmin:以分钟为单位通过文件的状态修改时间(change time)查找文件。 
-mmin:以分钟为单位通过文件的数据修改时间(modify time)查找文件。 
-atime:以天为单位通过文件的最后存取时间(access time)查找文件。 
-ctime:以天为单位通过文件的状态修改时间(change time)查找文件。 
-mtime:以天为单位通过文件的数据修改时间(change time)查找文件。 
-newer:查找比当前文件数据修改时间更加新一点的另外的文件。 
-anewer:查找比当前文件的最后存取时间更加新一点的另外的文件。 
-cnewer:查找比当前文件的状态时间更加新一点的另外的文件。 

+n:表示大于n。 
-n:表示小于n。 
n:表示等于n。

想找到文件修改时间比/etc/passwd文件的change time更新的文件
find /etc/ -newermc /etc/passwd
“-newerXY”用法,如:
-newermc就是拿待比较文件的modify time时间跟参数指定文件的change time进行比较。X和Y可以使用的字母为: 
a:文件access time。 
c:文件change time。 
m:文件modify time。

组合条件
-a 与
-o 或
-not 非
! 非

动作
-print:默认的处理动作,显示至屏幕;
-ls:类似于对查找到的文件执行“ls -l”命令
-delete:删除查找到的文件;
-flsfile:查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令;对于每个文件执行命令之前,都会交互式要求用户确认。
-exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令。{}: 占位符,用于引用查找到的文件名。用 “| xargs cmd” 代替效率更高。

删除当前目录下大小为零的文件
find . -size 0 -exec rm {} \; 不带确认
find . -size 0 -ok rm {} \; 带确认

-exec的\和+
对每个找到的文件执行一次命令
(因为有多条命令,所以要用;分割。\又对;转义,让find来解读而非bash)
$ find . -maxdepth 1 -type f -name "zero*" -exec echo {} \;    
./zero2
./zero1
./zero3
对所有找到的文件统一执行一次命令
$ find . -maxdepth 1 -type f -name "zero*" -exec echo {} +
./zero2 ./zero1 ./zero3

查找系统中任何用户都有写权限的文件或目录
文件
find / -type f -perm -2 -o -perm -20 | xargs ls -la
目录
find / -type d -perm -2 -o -perm -20 | xargs ls -ld

查找系统中所有设置了SUID/SGID的程序
find / -type f -perm -4000 -o -perm -2000 | xargs ls -la
find / -type f -perm /6000 | xargs ls -l
find / -user root -perm -2000 -print -exec md5sum {} \;
find / -user root -perm -4000 -print -exec md5sum {} \;

搜索没有属主及属组的文件
find / -nouser -o -nogroup -ls
  • 使用 xargs 进行操作

xargs 命令从标准输入流中获取参数,并基于它们执行命令。继续使用上一节中的示例,假设你要将上周修改过的家目录中的所有 JPEG 文件复制到 U 盘,以便插到电子相册上。假设你已经将 U 盘挂载到 /media/photo_display。

find ~ \( -iname '*jpeg' -o -iname '*jpg' \) -type f -mtime -7 -print0 | xargs -0 cp -t /media/photo_display

这里的 find 命令与以前的版本略有不同。-print0 命令让输出有一些更改:它不使用换行符,而是添加了一个 null 字符。xargs 的 -0(零)选项可调整解析以达到预期效果。这很重要,不然对包含空格、引号或其他特殊字符的文件名执行操作可能无法按预期进行。对文件采取任何操作时,都应使用这些选项。
cp 命令的 -t 参数很重要,因为 cp 通常要求目的地址在最后。你可以不使用 xargs 而使用 find 的 -exec 执行此操作,但是 xargs 的方式会更快,尤其是对于大量文件,因为它会单次调用 cp。

  • 参考文献
    https://fedoramagazine.org/command-line-quick-tips-locate-and-process-files-with-find-and-xargs/
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值