一、标准输入与管道命令
Unix 命令都带有参数,有些命令可以接受"标准输入"(stdin)作为参数。
$ cat /etc/passwd | grep root
上面的代码使用了管道命令(|
)。管道命令的作用,是将左侧命令(cat /etc/passwd)的标准输出转换为标准输入,提供给右侧命令(grep root)作为参数。
因为 grep 命令可以接受标准输入作为参数,所以上面的代码等同于下面的代码。
$ grep root /etc/passwd
但是,大多数命令都不接受标准输入作为参数,只能直接在命令行输入参数,这导致无法用管道命令传递参数。举例来说,echo
命令就不接受管道传参。
$ echo "hello world" | echo
上面的代码不会有输出。因为管道右侧的 echo 不接受管道传来的标准输入作为参数。
二、xargs 命令的作用
xargs命令是给其他命令传递参数的一个过滤器,也是组合多个命令的一个工具。它擅长将标准输入数据转换成命令行参数,xargs能够处理管道或者stdin并将其转换成特定命令的命令参数,也能够从文件的输出中读取数据。xargs也可以将单行或多行文本输入转换为其他格式,例如多行变单行,单行变多行。
$ echo "hello world" | xargs echo
hello world
上面的代码将管道左侧的标准输入,转为命令行参数hello world,传给第二个 echo 命令。
xargs命令的格式如下。
$ xargs [-options] [command]
参数说明:
- -a file 从文件中读入作为 stdin
- -e flag ,注意有的时候可能会是-E,flag必须是一个以空格分隔的标志,当xargs分析到含有flag这个标志的时候就停止。
- -p 当每次执行一个argument的时候询问一次用户。
- -n num 后面加次数,表示命令在执行的时候一次用的argument的个数,默认是用所有的。
- -t 表示先打印命令,然后再执行。
- -i 或者是-I,这得看linux支持了,将xargs的每项名称,一般是一行一行赋值给 {},可以用 {} 代替。
- -r no-run-if-empty 当xargs的输入为空的时候则停止xargs,不用再去执行了。
- -s num 命令行的最大字符数,指的是 xargs 后面那个命令的最大命令行字符数。
- -L num 从标准输入一次读取 num 行送给 command 命令。
- -l 同 -L。
- -d delim 分隔符,默认的xargs分隔符是回车,argument的分隔符是空格,这里修改的是xargs的分隔符。
- -x exit的意思,主要是配合-s使用。。
- -P 修改最大的进程数,默认是1,为0时候为as many as it can。
真正执行的命令,紧跟在 xargs 后面,接受 xargs 传来的参数。
xargs的作用在于,大多数命令(比如 rm、mkdir、ls)与管道一起使用时,都需要xargs将标准输入转为命令行参数。
$ echo "one two three" | xargs mkdir
上面的代码等同于 mkdir one two three。如果不加 xargs 就会报错,提示 mkdir 缺少操作参数。
三、xargs 的单独使用
xargs 后面的命令默认是 echo。
$ xargs
# 等同于
$ xargs echo
大多数时候,xargs命令都是跟管道一起使用的。但是,它也可以单独使用。
输入xargs 按下回车以后,命令行就会等待用户输入,作为标准输入。你可以输入任意内容,然后按下Ctrl d,表示输入结束,这时 echo 命令就会把前面的输入打印出来。
$ xargs echo
hello (Ctrl + d)
hello
再看一个例子。
$ xargs find -name
"*.txt"
./foo.txt
./hello.txt
上面的例子输入 xargs find -name 以后,命令行会等待用户输入所要搜索的文件。用户输入 "*.txt",表示搜索当前目录下的所有 TXT 文件,然后按下 Ctrl d,表示输入结束。这时就相当执行 find -name *.txt。
四、-d 参数与分隔符
默认情况下,xargs将换行符和空格作为分隔符,把标准输入分解成一个个命令行参数。这意味着通过管道传递给xargs的输入将会包含换行和空白,不过通过xargs的处理,换行和空白将被空格取代。
xargs 默认将文件中的多行输出为一行,其中将空白(空格,换行符,制表符)是输入分隔符,空格是输出分隔符:
cat xrags.txt
a b c d e f g
h i j k l m n
o p q
r s t
u v w
x y z
cat xrags.txt | xargs
a b c d e f g h i j k l m n o p q r s t u v w x y z
$ echo "one two three" | xargs mkdir
上面代码中,mkdir 会新建三个子目录,因为 xargs 将 one two three 分解成三个命令行参数,执行mkdir one two three。
-d参数可以指定分隔符。
$ echo -e "a\tb\tc" | xargs -d "\t" echo
a b c
上面的命令指定制表符 \t 作为分隔符,所以 a\tb\tc 就转换成了三个命令行参数。echo 命令的 -e参数表示解释转义字符。
echo "nameXnameXnameXname" | xargs -d X -n 2
name name
name name
五、-p 参数,-t 参数
使用 xargs 命令以后,由于存在转换参数过程,有时需要确认一下到底执行的是什么命令。
-p 参数打印出要执行的命令,询问用户是否要执行。
$ echo 'one two three' | xargs -p touch
touch one two three ?...
上面的命令执行以后,会打印出最终要执行的命令,让用户确认。用户输入 y 以后(大小写皆可),才会真正执行。
-t 参数则是打印出最终要执行的命令,然后直接执行,不需要用户确认。
$ echo 'one two three' | xargs -t rm
rm one two three
六、-0 参数与 find 命令
由于 xargs 默认将空格作为分隔符,所以不太适合处理文件名,因为文件名可能包含空格。
find 命令有一个特别的参数 -print0,指定输出的文件列表以 null(\0) 分隔。然后,xargs 命令的 -0 参数表示用 null(\0) 当作分隔符。
$ find /path -type f -print0 | xargs -0 rm
上面命令删除 /path 路径下的所有文件。由于分隔符是 null, 所以处理包含空格的文件名,也不会报错。
#统计一个源代码目录中所有 php 文件的行数:
find . -type f -name "*.php" -print0 | xargs -0 wc -l
#查找所有的 jpg 文件,并且压缩它们:
find . -type f -name "*.jpg" -print | xargs tar -czvf images.tar.gz
还有一个原因,使得 xargs 特别适合find 命令。有些命令(比如 rm)一旦参数过多会报错"参数列表过长",而无法执行,改用 xargs 就没有这个问题,因为它对每个参数执行一次命令。
$ find . -name "*.txt" | xargs grep "abc"
上面命令找出所有 TXT 文件以后,对每个文件搜索一次是否包含字符串 abc。
七、-L 参数
如果标准输入包含多行,-L 参数指定多少行作为一个命令行参数。
$ xargs find -name
"*.txt"
"*.md"
find: paths must precede expression: `*.md'
上面命令同时将 "*.txt" 和 *.md 两行作为命令行参数,传给 find 命令导致报错。
使用 -L 参数,指定每行作为一个命令行参数,就不会报错。
$ xargs -L 1 find -name
"*.txt"
./foo.txt
./hello.txt
"*.md"
./README.md
上面命令指定了每一行(-L 1)作为命令行参数,分别运行一次命令(find -name)。
下面是另一个例子。
$ echo -e "a\nb\nc" | xargs -L 1 echo
a
b
c
上面代码指定每行运行一次 echo 命令,所以 echo 命令执行了三次,输出了三行。
八、-n 参数
-L 参数虽然解决了多行的问题,但是有时用户会在同一行输入多项。
$ xargs find -name
"*.txt" "*.md"
find: paths must precede expression: `*.md'
上面的命令将同一行的两项作为命令行参数,导致报错。
-n 参数指定每次将多少项,作为命令行参数。
$ xargs -n 1 find -name
上面命令指定将每一项( -n 1 )标准输入作为命令行参数,分别执行一次命令(find -name)。
下面是另一个例子。
$ echo {0..9} | xargs -n 2 echo
0 1
2 3
4 5
6 7
8 9
上面命令指定,每两个参数运行一次 echo 命令。所以,10个阿拉伯数字运行了五次 echo 命令,输出了五行。
cat xrags.txt | xargs -n 3
a b c
d e f
g h i
j k l
m n o
p q r
s t u
v w x
y z
九、-I 参数
如果 xargs 要将命令行参数传给多个命令,可以使用-I
参数。
-I
指定每一项命令行参数的替代字符串。
$ cat foo.txt
one
two
three
$ cat foo.txt | xargs -I file sh -c 'echo file; mkdir file'
one
two
three
$ ls
one two three
上面代码中,foo.txt是一个三行的文本文件。我们希望对每一项命令行参数,执行两个命令( echo 和 mkdir ),使用-I
file 表示 file 是命令行参数的替代字符串。执行命令时,具体的参数会替代掉 echo file; mkdir 里面的两个 file。
cat sk.sh
#!/bin/bash
#sk.sh 命令内容,打印出所有参数
echo $*
cat arg.txt
aaa
bbb
ccc
cat arg.txt | xargs -I {} ./sk.sh -p {} -l
-p aaa -l
-p bbb -l
-p ccc -l
在上例中 -I 指定替换字符串 {}(只能替换单个子串), 这个字符串在xargs扩展时会被替换掉,当 -I 与 xargs 结合使用,每一个参数命令都会被执行一次。
#复制所有图片文件到 /data/images 目录下:
ls *.jpg | xargs -n1 -I {} cp {} /data/images
十、--max-procs 参数
xargs 默认只用一个进程执行命令。如果命令要执行多次,必须等上一次执行完,才能执行下一次。
--max-procs 参数指定同时用多少个进程并行执行命令。--max-procs 2表示同时最多使用两个进程,--max-procs 0表示不限制进程数。
$ docker ps -q | xargs -n 1 --max-procs 0 docker kill
上面命令表示,同时关闭尽可能多的 Docker 容器,这样运行速度会快很多。
十一、与find联合使用
在使用 find 命令的 -exec 选项处理匹配到的文件时, find命令将所有匹配到的文件一起传递给exec 执行。但有些系统对能够传递给 exec 的命令长度有限制,这样在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是 xargs 命令的用处所在,特别是与 find 命令一起使用。
find 命令把匹配到的文件传递给 xargs 命令,而 xargs 命令每次只获取一部分文件而不是全部,不像 -exec 选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。
在有些系统中,使用 -exec 选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高;
而使用 xargs 命令则只有一个进程。另外,在使用 xargs 命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。
来看看 xargs 命令是如何同 find 命令一起使用的,并给出一些例子。
find . -type f -print | xargs file //查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件
find / -name "core" -print | xargs echo "" >/tmp/core.log //在整个系统中查找内存信息转储文件(core dump) ,然后把结果保存到/tmp/core.log 文件中:
find . -type f -print | xargs grep "hostname" //用grep命令在所有的普通文件中搜索hostname这个词
find ./ -mtime +3 -print|xargs rm -f –r //删除3天以前的所有东西 (find . -ctime +3 -exec rm -rf {} \;)
find ./ -size 0 | xargs rm -f & //删除文件大小为零的文件
find命令配合使用 exec 和 xargs 可以使用户对所匹配到的文件执行几乎所有的命令。
参考
https://zhuanlan.zhihu.com/p/340804463