sed命令详解

原文链接:https://www.jianshu.com/p/89163e927a2c

1. 简介

sed命令是一个很强大的文本编辑器,可以对来自文件、以及标准输入的文本进行编辑。

执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。

所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。

sed命令的基本语法如下:

sed [options] commands [inputfile...]

options表示sed命令的一些选项,常见的选项如下表:

选项名作用
-n取消默认输出
-e多点编辑,可以执行多个子命令
-f从脚本文件中读取命令(sed操作可以事先写入脚本,然后通过-f读取并执行)
-i直接编辑原文件
-l指定行的长度
-r在脚本中使用扩展表达式

2. 应用场景

sed命令比较适用于大的文本文件,用普通文本编辑器难以胜任的情况。下面分别介绍直接打印、插入、删除、替换等编辑操作。
   实验用文件内容

#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566

(1)行打印,输出缓冲区内容,使用sed的p子命令

sed '1,3 p' test1.txt
echo "====================="
sed -n '1,3 p' test1.txt

#输出结果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode

p子命令代表print,可以打印出sed缓冲区内的内容。
sed命令中,直接采用数字代表某个特定的文本行:'1 p'代表打印第一行;'1,3 p'代表打印1到3行;特别的,最后一行的行号为$。

观察输出结果,不使用-n选项时,sed命令把1到3行输出了两次。这是因为不使用-n时,sed首先读取一行,并默认将缓冲区内的文本输出出来,之后p子命令再次输出。使用-n时,默认输出取消,只有p子命令的输出结果。

sed -n '/^ma/,5 p' test1.txt

#输出结果
mail
uuencode
1003605091
01566

sed命令支持正则表达式定位。语法为/re/,re表示正则表达式。
本例表示打印出从匹配正则表达式的地方到第5行,也就是从匹配以ma开头的文本行处开始。

sed -n '1~2 p' test1.txt

#输出结果
letitia
uuencode
01566

1~2表示从第一行开始,行号递增2输出,即输出奇数行。语法格式为first~step

(2)插入文本行,追加文本行
这两种情况很类似。插入文本使用i子命令,表示在指定位置前面插入文本;追加文本使用a子命令,表示在指定位置之后插入文本。观察一下两个的区别:

sed -n -e '2 i insert' -e '1,4 p' test1.txt 

#-e选项表示多个子命令,本例执行i子命令之后执行了p子命令
#输出结果
letitia
insert
mail
uuencode
1003605091
sed -n -e '2 a insert' -e '1,4 p' test1.txt

#输出结果
letitia
mail
insert
uuencode
1003605091

(3)删除文本行,使用d子命令

sed -n -e '2 d' -e '1,$ p' test1.txt

#输出结果
letitia
uuencode
1003605091
01566

(4)替换文本行,使用c子命令

sed -n -e '2 c newmail' -e '1,$ p' test1.txt

#输出结果
letitia
newmail
uuencode
1003605091
01566

【注】以上均未使用-i选项,所以更改的只是副本。

<b>(5)替换指定文本,使用s子命令</b>
这一个命令实用性很广,并且灵活。语法也比之上面特别一些:

sed '位置参数 s/pattern/replaced/[flag]'

pattern为要替换的文本,支持正则表达式,replaced表示用来替换的一般字符串(不支持正则表达式)。

flag是替换标志,用来影响匹配替换的规则:

flag用法
g全局匹配,会替换文本行中所有匹配的字符串
十进制n替换文本行中第n个匹配的字符串
p替换第一个匹配的字符串,并且将缓冲区输出到标准输出
w替换第一个匹配的字符串,并且将改动的行输出到磁盘文件中
缺省替换第一个匹配的字符串
sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
#{}要转义,因为此处使用的不是扩展正则表达式

#输出结果
letitia
mail
uuencode
miss letitia
01566
sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt

#输出结果
Letitia
maiL
uuencode
miss letitia
01566
#可以看到,本例将前两行里的l替换为L。
sed -n '1,3{
            s/l/L/g
            s/e/E/g
            2 i tyrone
            p
            }' test1.txt

#输出结果
LEtitia
tyrone
maiL
uuEncodE

最后这个例子比较复杂。使用大括号,表示对1到3行做了一组操作。

3. 其他的小事

  • 以上都是采用了文件输入做实验,也可以采用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
#将grep的结果作为输入,注意要用反引号括起来,将括号内部分解释为linux命令
  • 当用户的编辑操作比较复杂时,建议使用sed脚本文件。
  • 同正则表达式一样,匹配元字符时要用转义。使用基本正则表达式时,{}等也要转义。



作者:tyrone_li
链接:https://www.jianshu.com/p/89163e927a2c
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值