一、sed工具
sed是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。sed也可以再无交互的情况下实现相当复杂的文本处理操作,被广泛应用于Shell脚本中,可以完成各种自动化处理任务。
sed 的工作流程主要包括读取、执行和显示三个过程。
读取:sed从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间)
执行:默认情况下,所有的sed命令都在模式空间中顺序地执行,除非指定了行的地址,否则sed命令将会在所有的行依次执行。
显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。在所有的我呢见内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。
注意:默认情况下所有的sed命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。
二、sed命令用法
通常情况下调用sed命令有两种格式。
其中,“参数"是指操作的目标文件,当存在多个操作对象时,文件之间用逗号”,“分隔;而scriptfile表示脚本文件,需要用”-f
"选项指定,当脚本文件出现再目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。
sed [选项] '操作' 参数
sed [选项] -f scriptfile 参数
1.常见的sed命令选项
常见选项
-e或--expression=:表示用指定命令或者脚本来处理输入的文本文件
-f或--file=:表示用指定的脚本文件来处理输入的文本文件
-h或--help:显示帮助
-n、--quiet或silent:表示仅显示处理后的结果
-i.bak:备份文件并原处编辑
-r,-E:使用扩展正则表达式
-s:将多个文件视为独立文件,而不是单个连续的长文件流
操作
“操作"用于指定对文件操作的动作行为,也就是sed的命令。通常情况下是采用的”[n1[,n2]]“操作参数的格式。n1、n2是可选的,代表选择进行操作的行数,如操作需要在5~20行之间进行,则表示为"5,20动作行为”
常见的操作包括以下几种
a:增加,在当前行下面增加一行指定内容
c:替换,将选定行替换为指定内容
d:删除,删除选定的行
i:插入,在选定行上面插入一行指定内容
p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以ASCLL码输出。通常与"-n"选项一起使用
s:替换,替换指定字符
y:字符转换
2.用法示例
2.1 sed的基本用法
1.输出符合条件的文本(p表示正常输出)
sed -n 'p' test.txt //输出所有内容,等同于cat test.txt
sed -n '3p' test.txt //输出第三行
sed -n '3,5p' test.txt //输出3-5行
nl test.txt | sed -n '1,9{p;n}' //输出1到9行中的奇数行
nl test.txt |sed -n '1,9{n:p}' //输出1到9行中的偶数行
sed -n '10,${n;p}' test.txt //输出第10行至文件尾之间的偶数行
在执行"sed -n ‘10,${n;p}’ "命令时,读取的是第一行是文件的第10行,读取的第2行是文件的第11行,依次类推,所以输出的是文件的第11行、13行直至文件结尾,其中会包括空行
2.删除符合条件的文本(d)
nl test.txt |sed '3,5d' //删除3-5行
2.2 sed结合正则表达式用法
sed命令结合正则表达式时,格式略有不同,正则表达式以"/"包围
1.输出符合条件的文本
sed -n '/the/p' test.txt //输出包含the的行