Linux文本处理三剑客

本文详细介绍了Linux中的文本处理工具grep、sed和awk。grep用于文本过滤和搜索,支持多种选项和模式匹配。sed是一个流编辑器,可以对文件逐行处理并执行各种编辑操作。awk则是一个报告生成器,擅长格式化文本输出,其程序结构包含模式和动作,内置多种变量和函数,可用于复杂的数据处理。
摘要由CSDN通过智能技术生成

1. grep

文本过滤(模式:pattern)工具,grep, egrep, fgrep(不支持正则表达式搜索)

grep [OPTIONS] PATTERN [FILE...]

  • --color=auto 对匹配到的文本着色显示
  • -v 显示不被pattern匹配到的行
  • -i 忽略字符大小写
  • -n 显示匹配的行号
  • -c 统计匹配的行数
  • -o 仅显示匹配到的字符串
  • -q 静默模式,不输出任何信息
  • -A # after, 后#行
  • -B # before, 前#行
  • -C # context, 前后各#行
  • -e 实现多个选项间的逻辑or关系
    grep –e ‘cat ’ -e ‘dog’ file
  • -w 匹配整个单词
  • -E 使用ERE,相当于egrep
  • -F 相当于fgrep,不支持正则表达式

2. sed

sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’ 的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。

sed [option]... 'script' inputfile

  1. 选项
    • -n 不输出模式空间内容到屏幕,即不自动打印
    • -e 多点编辑
    • -f /PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
    • -r 支持使用扩展正则表达式
    • -i.bak 备份文件并原处编辑
  2. script 地址定界
    1. 不给地址:对全文进行处理
    2. 单地址:
      #: 指定的行,$:最后一行
      /pattern/:被此处模式所能够匹配到的每一行
    3. 地址范围:
      #,#
      #,+#
      /pat1/,/pat2/
      `#,/pat1/
    4. ~:步进
      1~2 奇数行
      2~2 偶数行
  3. 编辑命令:
    • d 删除模式空间匹配的行,并立即启用下一轮循环
    • p 打印当前模式空间内容,追加到默认输出之后
    • a [\]te
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值