shell编程之sed命令

sed :stream Editor(流式文本编辑器)

什么是sed?

sed流式编辑器,一行行的处理命令,自动编辑一个或多个文件、简化对文件的反复操作、编写转换程序等,工作流程如下

sed 是一种在线的、非交互式的编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出,或者使用sed -i选项
-i选项就是将本该输出到屏幕上的内容输出/流入文件中

为何用sed?

sed 对比vim
1、sed可以把处理文件的规则先写好,然后用同一套规则编辑多个文件而vim只能一个个编辑 =》用一套规则处理多个文件
2、 sed处理文件,一次只处理一行,及同一时间内存中只有文件的一行内容,所以无论文件多大,都不会对内存造成过大的压力 =》用于处理大文件

如何用sed?

sed -选项 ‘规则’ 文件名(自带一个默认输出)
选项:
-n:取消默认输出
-i:将输出到屏幕中的结果(即规则处理的和默认输出的结果)覆盖到原文件当中 ps:调节完毕之后再使用此命令
-e 允许多项编辑
-r 支持扩展元字符
-f 指定sed脚本文件名

sed命令组成

命令由”地址+命令“两部分组成,命令如p、d
地址用于决定对流入模式空间的哪些行进行编辑,如果没有指定地址,sed将处理流入模式空间的所有行。

地址可以是
1.可以用行号(数字)进行定位,2.可以用正则表达式进行定位

行号(数字)定位:利用数字来定位
示例:
sed  '1p' a.txt
输出结果:第一行被重复输出了遍到屏幕上(原理:将文件第一行内容输出到屏幕上,默认输出整个文件内容到屏幕上)

sed '1,3p' a.txt
输出结果为:第一到三行都被重复输出到屏幕上   (原理:将文件第一行内容到第三行内容输出到屏幕上,默认输出整个文件内容到屏幕上)

sed '3;5p' a.txt
输出结果为:第三行内容,第五行内容被重复输出到屏幕上(原理:将文件第三行内容,第五行内容输出到屏幕上,默认输出整个文件内容到屏幕上)

正则定位:两个左斜杠,斜杠中间是匹配规则(定位规则)

与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是
括在斜杠间的模式,用于查找和替换,以下是sed支持的元字符。
# 使用基本元字符集	
^, $, ., *, [], [^], \< \>,\(\),\{\}

# 使用扩展元字符集	
?, +, { }, |, ( )

# 使用扩展元字符的方式:
转义,如\+
-r参数,如sed -r

[root@aliyun ~]# cat test.txt 
1111111
2222222egon
333333egon
444444egon
555555eon
[root@aliyun ~]# sed -rn '/egon/p' test.txt 
2222222egon
333333egon
444444egon

数字+正则表达式

[root@aliyun ~]# cat test.txt 
1111111
2222222egon
333333egon
444444egon
555555eon
[root@aliyun ~]# sed -rn '1,/egon/p' test.txt 
1111111
2222222egon
[root@aliyun ~]# 

解释:
# "1,8p"代表打印1到8行,"1,/egon/p"则代表取从第1行到首次匹配到/egon/的行

命令:

**
a 在当前行后添加一行或多行
c 用新文本修改(替换)当前行中的文本
i 在当前行之前插入文本
l 会用$符号标识出文件中看不到的字符的位置
p:文件输出到屏幕
d:删除内存中的文件,通常输出结果为空
s:替换 用法:s/要替换的内容/替换的内容/(此处//为分隔符,也可以用其他符号做分隔符)
与s一起使用的是g和i
g 在行内进行全局替换
i 忽略大小写(跟s一起使用时)
n 把下一行内容读入模式空间(sed内置的一个缓冲区),后续的处理命令处理的都是刚读入的新内容
q 结束或退出sed,不会将后续内容读入模式空间
r 从文件中读
! 对所选行以外的所有行应用命令
w 将行写入文件
y 将字符转换为另一字符(不支持正则表达式),y/egon/1234/ e->1 g->2 o->3 n->4
h 把模式空间里的内容复制到暂存缓冲区(覆盖)
H 把模式空间里的内容追加到暂存缓冲区
g 取出暂存缓冲区的内容,将其复制到模式空间,覆盖该处原有内容
G 取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面
x 交换暂存缓冲区与模式空间的内容
**
案例:

打印命令:p
#打印a.txt文件中包含egon的行
sed -r “/egon/p” a.txt
#打印a.txt文件中包含egon的行,并显示其在文件中的对应行数
sed -r -n “/egon/p” a.txt

删除命令:d,注意用单引号
#删除第三行内容
sed -r ‘3d’ a.txt
#删除第三行到文件末尾的行
sed -r ‘3,$d’ a.txt
#删除文件中末尾的行
sed -r ‘$d’ a.txt
#删除文件中包含egon的行
sed -r ‘/egon/d’ a.txt
sed -r ‘1,/egon/{/egon/d}’ a.txt # 只删除模式匹配成功的第一行

替换命令:s
#只匹配一个egon换为Bigegon
sed -r ‘s/egon/Bigegon/’ a.txt
#将文中所有egon都替换成Bigegon
sed -r ‘s/egon/Bigegon/g’ a.txt
#将文中以egon开头的行中的第一个egon换成Bigegon
sed -r ‘s/^egon/Bigegon/g’ a.txt
将文件中的root换成egon
sed -r -n ‘s/root/egon/gip’ /etc/passwd
sed -r ‘s/[0-9]$/&.change/’ a.txt # &代表取到匹配成功的整行内容

sed -r ‘s/^([a-zA-Z]+)([^[a-zA-Z]+)/\2\1/’ a.txt
sed -r ‘s#egon#bigegon#g’ a.txt

多重编辑命令:e
sed -r -e ‘1,3d’ -e ‘s/[Ee]gon/EGON/g’ a.txt # 在前一个-e的基础之上进行第二个-e操作
sed -r ‘1,3d;s/[Ee]gon/EGON/g’ a.txt

sed -r ‘3{s/[0-9]/x/g;s/[Ee]gon/EGON/g}’ a.txt # 只处理第三行
sed -r ‘1,3{s/[0-9]/x/g;s/[Ee]gon/EGON/g}’ a.txt # 处理1到3行

sed -r -n ‘1p;p’ a.txt # ;分隔依次运行,先针对第一行进行p操作,再针对所有行进行p操作
sed -r -n ‘1{p;p}’ a.txt # 只针对第一行,连续进行两次p操作

反向选择!
sed -r ‘3d’ a.txt
sed -r ‘3!d’ a.txt

读文件命令:r
sed -r ‘/^Egon/r b.txt’ a.txt # 在匹配成功的行后添加文件b.txt的内容
sed -r ‘/2/r b.txt’ a.txt # 在第2行后面添加文件b.txt的内容

写文件命令:w
sed -r ‘/[Ee]gon/w b.txt’ a.txt # 将匹配成功的行写入新文件b.txt
sed -r ‘3,$w /root/new.txt’ a.txt # 将第3行到最后一行写入/root/new.txt

追加命令:a
sed -r ‘2aXXXXXXXXXXXXXXXXXXXX’ a.txt #在第2行后添加一行
sed -r '2a1111111111111\ # 可以用\续行

222222222222
333333333333’ a.txt

插入命令:i
sed -r ‘2i1111111111111’ /etc/hosts
sed -r '2i111111111\

2222222222
3333333333’ a.txt

修改命令:c
sed -r ‘2c1111111111111’ a.txt
sed -r '2c111111111111\

22222222222
33333333333’ a.txt

把下一行内容读入模式空间:n
#sed -r ‘/^Egon/{n;s/[0-9]/x/g}’ a.txt # 将匹配/^Egon/成功的行的下一行读入模式空间进行s处理
[root@aliyun ~]# cat a.txt
/etc/egon/666
etc
[root@aliyun ~]# sed -r ‘#/etc/egon/666#n;c 1111’ a.txt
/etc/egon/666
1111
[root@aliyun ~]#

转换命令:y
#sed -r ‘1,3y/Eeo/12X/’ a.txt # 1到3行进行转换 对应规则:a->1 e->2 o->X

退出:q
#sed -r ‘5q’ a.txt
#sed -r ‘/[Ee]gon/{ s/[0-9]/X/; q; }’ a.txt # 匹配成功/[Ee]gon/则执行{}内命令,q代表退出,即替换一次则退出,如果文件中多行符合规则的内容也只替换了第一个

​拓展内容:
sed 有两个内置的存储空间:
模式空间(pattern space)
如你所知,模式空间用于 sed 执行的正常流程中。该空间 sed 内置的一个缓冲区,用来存放、修改从输入文件读取的内容。

保持空间(hold space)
保持空间是另外一个缓冲区,用来存放临时数据。Sed 可以在保持空间和模式空间交换数据,但是不能在保持空间上执行普通的 sed 命令。

每次循环读取数据过程中,模式空间的内容都会被清空,然而保持空间的内容则保持不变,不会在循环中被删除。
模式空间与保持空间的操作命令

x:命令x(exchange) 用于交换模式空间和保持空间的内容
​
h:模式空间复制/覆盖到保持空间
H:模式空间追加到保持空间
​
g:保持空间复制/覆盖到模式空间
G:保持空间追加到模式空间
​
n:读取下一行到/覆盖到模式空间
N:将下一行添加到模式空间

d:删除pattern space中的所有行,并读入下一新行到pattern space中

示例:交换文件的行

[root@egon ~]# cat test.txt 
1111
2222
3333

# ======================方式1:======================
[root@egon ~]# tac test.txt 
3333
2222
1111
[root@egon ~]# 

# ======================方式2:======================
思路:
# 1、读取文件第一行内容到模式空间,进行的操作如下  
# 将模式空间内容覆盖到保持空间
# 删除模式空间内容
   
# 2、读取文件第二行内容到模式空间,进行的操作如下  
# 将保持内容追加到模式空间
# 将模式空间内容覆盖到保持空间
# 删除模式空间内容 

# 3、读取文件第三行内容到模式空间,进行的操作如下  
# 将保持空间内容追加到模式空间

实现:
sed -r '1h;1d;2G;2h;2d;3G' test.txt
或者
sed '1!G;h;$!d' test.txt

五 sed脚本

sed脚本就是写在文件中的一系列sed命令,使用-f 选项指定sed脚本文件名,需要注意的问题如下

  • 脚本末尾不能有任何多余的空格或文本
  • 如果命令不能独占一行,就必须以\结尾
  • 脚本中不能使用引号,除非它们是查找串的一部分
  • 反斜杠起到续行的作用
[root@egon ~]# cat sed.sh #永久存储,存了多行sed命令,相当于多道关卡,每读入一行内容将经历一道道关卡
1h;1d;2G;2h;2d;3G
1h;1d;2G;2h;2d;3G

[root@egon ~]# sed -r '' a.txt
1111
2222
3333
[root@egon ~]# 
[root@egon ~]# sed -r -f sed.sh test.txt 
3333
2222
1111
2222
1111
[root@egon ~]# 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值