网络编程三剑客之sed

本文详细介绍了Linux/UNIX系统中的文本处理工具sed,包括其工作流程、常见用法、删除、替换、迁移文本的操作,以及如何使用脚本编辑文件。sed是一个强大的文本解析转换工具,常用于Shell编程中的文本处理,如删除、替换、插入等操作。通过示例展示了如何使用sed进行具体操作,如删除特定行、替换字符串、迁移文本等。
摘要由CSDN通过智能技术生成

目录

一、sed工具

1.1 sed的工作流程

1.2 sed 命令常见用法

1.2-1 sed操作格式:

1.2-2 常见的sed命令选项主要有

1.2-3常见的操作参数

2、删除符合条件的文本

3、替换符合条件的文本

4、迁移符合条件的文本 

5、使用脚本编辑文件 


在Linux/UNIX 系统中包含很多种类的文本处理器或文本编辑器,其中包括我们之前学习过的VIM 编辑器与grep 等。而 grep,sed,awk 更是Shell 编程中经常用到的文本处理工具, 被称之为Shell 编程三剑客。

一、sed工具

sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。sed也可以在无交互的情况下实现相当复杂的文本处理操作,被广泛应用于Shell脚本中,用以完成各种自动化处理任务。

1.1 sed的工作流程

sed 的工作流程主要包括读取、执行和显示三个过程。

读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。

执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行。

显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。
在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。

注意:默认情况下所有的 sed 命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。

1.2 sed 命令常见用法

通常情况下调用 sed 命令有两种格式,如下所示。其中,“参数”是指操作的目标文件, 当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“-f” 选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。

1.2-1 sed操作格式:

sed [选项] '操作' 参数
sed [选项] -f scriptfile 参数

1.2-2 常见的sed命令选项主要有

1.2-3常见的操作参数

“操作”用于指定对文件操作的动作行为,也就是 sed 的命令。通常情况下是采用的“[n1[,n2]]”操作参数的格式。n1、n2 是可选的,代表选择进行操作的行数,如操作需要在 5~ 20 行之间进行,则表示为“5,20 动作行为”。

常见的操作包括以下几种:

例1:

例2:

例3:

例4:

例5:

例6:

(注:在执行“sed -n‘10,${n;p}’test.txt”命令时,读取的第 1 行是文件的第 10 行,读取的第 2 行是文件的第 11 行,依此类推,所以输出的偶数行是文件的第 11 行、13 行直至文件结尾, 其中包括空行。)

以上是 sed 命令的基本用法,sed 命令结合正则表达式时,格式略有不同,正则表达式以“/”包围。例如,以下操作是 sed 命令与正则表达式结合使用的示例。

例7:

例8:

例9:

例10:

例11:

例12:

例13:

2、删除符合条件的文本

因为后面的示例还需要使用测试文件 tset.sh,所以在执行删除操作之前需要先将测试文件备份。以下示例分别演示了 sed 命令的几种常用删除用法。
(下面命令中 nl 命令用于计算文件的行数,结合该命令可以更加直观地查看到命令执行的结果。)

例1:

例2:

例3:

例4:如果不要删除包含cross的行,可以用!进行取反操作 

例5:

例6:

例7:

注意 : 若是删除重复的空行,即连续的空行只保留一个,“cat -s test.txt”。

3、替换符合条件的文本

在使用 sed 命令进行替换操作时需要用到 s(字符串替换)、c(整行/整块替换)、y(字符转换)命令选项,常见的用法如下所示。

例1:将每行中的第一个 the 替换为 THE

例2: 将每行中的第2个l替换成L

例3: 将文件中所有的the替换成THE,g是代表全局的意思

例4:将文件中的所有o 删除(替换为空串)

例5: 在每行的行首插入#号

例6: 在包含the 的每行行首插入#号

例7:在每行行尾插入字符串EOF

例8:将第 3~5 行中的所有 the 替换为 THE

例9:将包含the 的所有行中的 o 都替换为 O 

4、迁移符合条件的文本 

在使用 sed 命令迁移符合条件的文本时,常用到以下参数。

例1:将包含the 的行迁移至文件末尾,{;}用于多个操作

例2:将包含the 的行另存为文件 out.file

例3: 将文件/etc/hostname 的内容添加到包含 the 的每行以后

例4:在第 3 行后插入一个新行,内容为New 

例5:在包含the 的每行后插入一个新行,内容为 New 

例6:在第 3 行后插入多行内容,中间的\n 表示换行 

5、使用脚本编辑文件 

使用 sed 脚本将多个编辑指令存放到文件中(每行一条编辑指令),通过“-f”选项来调用。

将第 1~5 行内容转移至第 16 行后

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值