Shell 之 `|` 详解-CSDN博客

本文链接：https://blog.csdn.net/weixin_56303229/article/details/147877788

管道符 | 是 Shell 中最强大和最常用的功能之一，它允许将一个命令的输出直接作为另一个命令的输入。这种机制使得多个简单命令可以组合起来完成复杂任务。

管道符 | 的基本语法：

command1 | command2 | command3 ...

工作原理：

# 查看进程并筛选
ps aux | grep nginx

# 统计文件行数
cat file.txt | wc -l

# 排序并去重
cat data.log | sort | uniq

# 提取特定列并统计
cut -d',' -f2 data.csv | sort | uniq -c | sort -nr

# 分析日志文件
grep "ERROR" app.log | awk '{print $6}' | sort | uniq -c

# 监控CPU使用率
top -b -n 1 | grep "Cpu(s)"

# 查找大文件
find / -type f -size +100M | xargs ls -lh

# 将stderr也通过管道传递
command1 2>&1 | command2

# 只传递stderr
command1 2>&1 >/dev/null | command2

# 创建命名管道
mkfifo mypipe

# 使用命名管道
command1 > mypipe &
command2 < mypipe

# 保存中间结果
command1 | tee intermediate.txt | command2

# 多重输出
command1 | tee >(command2) >(command3) | command4

减少管道数量：每个管道都会创建新进程，尽量减少不必要的管道

# 不佳: 多个简单管道
cat file | grep "text" | wc -l

# 更好: 合并操作
grep -c "text" file

使用高效命令：某些命令组合可以替换为单一高效命令

# 不佳: 使用多个命令
cat file | tr ' ' '\n' | sort

# 更好: 使用awk
awk '{for(i=1;i<=NF;i++) print $i}' file | sort

缓冲区调整：对大容量数据流可以调整缓冲区大小

stdbuf -o0 command1 | command2  # 无缓冲
stdbuf -oL command1 | command2  # 行缓冲

# 设置pipefail选项检测管道中任何命令的失败
set -o pipefail
command1 | command2 | command3

# 使用缓冲工具
command1 | buffer | command2

# 或使用临时文件
command1 > tempfile
command2 < tempfile
rm tempfile

# 使用null字符分隔处理带空格文件名
find . -print0 | xargs -0 ls -l

curl -s http://example.com | grep -o "http://[^\"]*" | sort | uniq

# 找出内存占用最高的10个进程
ps aux | sort -nk +4 | tail -10

# CSV文件处理
cut -d',' -f2 data.csv | grep -v "NULL" | sort | uniq > results.txt