sed 简明教程

sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。

sed命令的语法格式:

sed的命令格式: sed [option] 'sed command'filename

sed的脚本格式:sed [option] -f 'sed script'filename

sed命令的选项(option):

-n :只打印模式匹配的行

-e :直接在命令行模式上进行sed动作编辑,此为默认选项

-f :将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作

-r :支持扩展表达式

-i :直接修改文件内容

sed在文件中查询文本的方式:

1)使用行号,可以是一个简单数字,或是一个行号范围

x

x为行号

x,y

表示行号从x到y

/pattern

查询包含模式的行

/pattern /pattern

查询包含两个模式的行

pattern/,x

在给定行号上查询包含模式的行

x,/pattern/

通过行号和模式查询匹配的行

x,y!

查询不包含指定行号x和y的行

\

\

\

2)使用正则表达式、扩展正则表达式(必须结合-r选项)

^

锚点行首的符合条件的内容,用法格式"^pattern"

$

锚点行首的符合条件的内容,用法格式"pattern$"

^$

空白行

.

匹配任意单个字符

*

匹配紧挨在前面的字符任意次(0,1,多次)

.*

匹配任意长度的任意字符

\?

匹配紧挨在前面的字符0次或1次

\{m,n\}

匹配其前面的字符至少m次,至多n次

\{m,\}

匹配其前面的字符至少m次

\{m\}

精确匹配前面的m次\{0,n\}:0到n次

\<

锚点词首----相当于 \b,用法格式:\<pattern

\>

锚点词尾,用法格式:\>pattern

\<pattern\>

单词锚点

 

分组,用法格式:pattern,引用\1,\2

[]

匹配指定范围内的任意单个字符

[^]

匹配指定范围外的任意单个字符

[:digit:]

所有数字, 相当于0-9, [0-9]---> [[:digit:]]

[:lower:]

所有的小写字母

[:upper:]

所有的大写字母

[:alpha:]

所有的字母

[:alnum:]

相当于0-9a-zA-Z

[:space:]

空白字符

[:punct:]

所有标点符号

[java]  view plain  copy
 
  1. #######sed的匹配模式支持正则表达式#####################  
  2. sed'5 q'/etc/passwd#打印前5行  
  3. sed-n '/r*t/p'/etc/passwd#打印匹配r有0个或者多个,后接一个t字符的行  
  4. sed-n '/.r.*/p'/etc/passwd#打印匹配有r的行并且r后面跟任意字符  
  5. sed-n '/o*/p'/etc/passwd#打印o字符重复任意次  
  6. sed-n '/o\{1,\}/p'/etc/passwd#打印o字重复出现一次以上  
  7. sed-n '/o\{1,3\}/p'/etc/passwd#打印o字重复出现一次到三次之间以上  

sed的编辑命令(sed command):

p

打印匹配行(和-n选项一起合用)

=

显示文件行号

a\

在定位行号后附加新文本信息

i\

在定位行号后插入新文本信息

d

删除定位行

c\

用新文本替换定位文本

w filename

写文本到一个文件,类似输出重定向 >

r filename

从另一个文件中读文本,类似输入重定向 <

s

使用替换模式替换相应模式

q

第一个模式匹配完成后退出或立即退出

l

显示与八进制ACSII代码等价的控制符

{}

在定位行执行的命令组,用分号隔开

n

从另一个文件中读文本下一行,并从下一条命令而不是第一条命令开始对其的处理

N

在数据流中添加下一行以创建用于处理的多行组

g

将模式2粘贴到/pattern n/

y

传送字符,替换单个字符

对文件的操作无非就是”增删改查“,怎样用sed命令实现对文件的”增删改查“,玩转sed是写自动化脚本必须的基础之一。

sed命令打印文件信息(查询):

[java]  view plain  copy
 
  1. ####用sed打印文件的信息的例子的命令######  
  2. sed -n '/^#/!p'  /etc/vsftpd/vsftpd.conf         
  3. sed -n '/^#/!{/^$/!p}'  /etc/vsftpd/vsftpd.conf  
  4. sed -e '/^#/d' -e '/^$/d'  /etc/vsftpd/vsftpd.conf  
  5. sed -n '1,/adm/p' /etc/passwd  
  6. sed -n '/adm/,6p' /etc/passwd  
  7. sed -n '/adm/,4p' /etc/passwd  
  8. sed -n '/adm/,2p' /etc/passwd  
  9. ###以下图片是对这些sed命令例子的解释和显示结果  

\

\

\

\

sed命令实现对文件内容的添加:(对源文件添加的话就用-i参数):

[java]  view plain  copy
 
  1. ####sed命令可以实现的添加######  
  2. #1)匹配行的行首添加,添加在同行  
  3. #2)匹配行的行中的某个字符后添加  
  4. #3)匹配行的行尾添加字符  
  5. #4)匹配行的行前面行添加  
  6. #5)匹配行的行后面行添加  
  7. #6)文件的行首添加一行  
  8.   [root@jie1 ~]# sed -i '1 i\sed command start' myfile  
  9. #7)文件的行尾追加一行  
  10.   [root@jie1 ~]# sed -i '$a \sed command end' myfile  

\

 

\

 

\

\

\

\

\

\

\

sed命令实现对文件内容的删除:(对源文件直接删除用-i参数):

sed的删除操作是针对文件的行,如果想删除行中的某个字符,那就用替换(别急,替换稍后就讲,而且替换是sed最常用的)

\

\

\

\

 重点:sed命令实现对文件内容的替换(替换是在shell自动化脚本中用到最多的操作)

[java]  view plain  copy
 
  1. #================源文件里面的内容===============================  
  2. [root@jie1 ~]# cat test  
  3. anonymous_enable=YES  
  4. write_enable=YES  
  5. local_umask=022  
  6. xferlog_enable=YES  
  7. connect_from_port_20=YES  
  8. root:x:0:0:root:/root:/bin/bash  
  9. bin:x:1:1:bin:/bin:/sbin/nologin  
  10. daemon:x:2:2:daemon:/sbin:/sbin/nologin  
  11. adm:x:3:4:adm:/var/adm:/sbin/nologin  
  12. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin  
  13. DEVICE="eth0"  
  14. BOOTPROTO="static"  
  15. HWADDR="00:0C:29:90:79:78"  
  16. ONBOOT="yes"  
  17. IPADDR=172.16.22.1  
  18. NETMASK=255.255.0.0  
  19. #======================================================================  
  20. [root@jie1 ~]# sed -i '/DEVICE/c\Ethernet' test   
  21.         #匹配DEVICE的行,替换成Ethernet这行  
  22. [root@jie1 ~]# sed -i 's/static/dhcp/' test       
  23.         #把static替换成dhcp(/,@,#都是前面所说的地址定界符)  
  24. [root@jie1 ~]# sed -i '/IPADDR/s@22\.1@10.12@' test  
  25.         #匹配IPADDR的行,把22.1替换成10.12由于.号有特殊意义所有需要转义  
  26. [root@jie1 ~]# sed -i '/connect/s#YES#NO#' test   
  27.         #匹配connect的行,把YES替换成NO  
  28. [root@jie1 ~]# sed -i 's/bin/tom/2g' test         
  29.         #把所有匹配到bin的行中第二次及第二次之后出现bin替换成tom  
  30. [root@jie1 ~]# sed -i 's/daemon/jerry/2p' test    
  31.         #把所有匹配到bin的行中第二次出现的daemon替换成jerry,并在生产与匹配行同样的行  
  32. [root@jie1 ~]# sed -i 's/adm/boss/2' test         
  33.         #把所有匹配到adm的行中仅仅只是第二次出现的adm替换成boss  
  34. [root@jie1 ~]# sed -i '/root/{s/bash/nologin/;s/0/1/g}' test  
  35.         #匹配root的行,把bash替换成nologin,且把0替换成1  
  36. [root@jie1 ~]# sed -i 's/root/(&)/g' test                   
  37.         #把root用括号括起来,&表示引用前面匹配的字符  
  38. [root@jie1 ~]# sed -i 's/BOOTPROTO/#BOOTPROTO/' test        
  39.         #匹配BOOTPROTO替换成#BOOTPROTO,在配置文件中一般用于注释某行  
  40. [root@jie1 ~]# sed -i 's/ONBOOT/#&/' test                   
  41.         #匹配ONBOOT的行的前面添加#号,在配置文件中也表示注释某行  
  42. [root@jie1 ~]# sed -i '/ONBOOT/s/#//' test                  
  43.         #匹配ONBOOT的行,把#替换成空,即去掉#号,也一般用作去掉#注释  
  44. #================执行以上sed命令之后文件显示的内容====================  
  45. [root@jie1 ~]# cat test  
  46. anonymous_enable=YES  
  47. write_enable=YES  
  48. local_umask=022  
  49. xferlog_enable=YES  
  50. connect_from_port_20=NO  
  51. (root):x:1:1:(root):/(root):/bin/nologin  
  52. bin:x:1:1:tom:/tom:/stom/nologin  
  53. daemon:x:2:2:jerry:/sbin:/stom/nologin  
  54. daemon:x:2:2:jerry:/sbin:/stom/nologin  
  55. adm:x:3:4:boss:/var/adm:/sbin/nologin  
  56. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin  
  57. Ethernet  
  58. #BOOTPROTO="dhcp"  
  59. HWADDR="00:0C:29:90:79:78"  
  60. ONBOOT="yes"  
  61. IPADDR=172.16.10.12  
  62. NETMASK=255.255.0.0  

sed引用变量:(在自动化shell脚本 中也经常会使用到变量)

第一种当sed命令里面没有默认的变量时可以把单引号改成双引号;

第二种当sed命令里面有默认的变量时,那自己定义的变量需要加单引号,且sed里面的语句必须用单引

[java]  view plain  copy
 
  1. [root@jie1 ~]# cat >> myfile << EOF  
  2. > hello world  
  3. > i am jie  
  4. > how are you  
  5. > EOF   #先生成一个文件  
  6. [root@jie1 ~]# cat myfile  
  7. hello world  
  8. i am jie  
  9. how are you  
  10. [root@jie1 ~]# name=li  
  11.          #定义一个变量,且给变量赋值  
  12. [root@jie1 ~]# sed -i "s/jie/$name/" myfile  
  13.          #把匹配jie的字符替换成变量的值  
  14. [root@jie1 ~]# cat myfile  
  15. hello world  
  16. i am li  
  17. how are you  
  18. [root@jie1 ~]# sed -i "$a $name" myfile  
  19.           #当sed命令也有默认变量时,在去引用自己定义的变量会出现语法错误  
  20. sed: -e expression #1, char 3: extra characters after command  
  21. [root@jie1 ~]# sed -i '$a '$name'' myfile  
  22.           #在引用自定义的变量时,sed语句必须用单引引住,然后把自定义的变量也用单引号引住  
  23. [root@jie1 ~]# cat myfile  
  24. hello world  
  25. i am li  
  26. how are you  
  27. li  
  28. [root@jie1 ~]#  

sed的其它高级使用:

1)把正在用sed操作的文件的内容写到例外一个文件中

[java]  view plain  copy
 
  1. [root@jie1 ~]# cat test   #sed操作的文件中的内容  
  2. Ethernet  
  3. #BOOTPROTO="dhcp"  
  4. HWADDR="00:0C:29:90:79:78"  
  5. ONBOOT="yes"  
  6. IPADDR=172.16.10.12  
  7. NETMASK=255.255.0.0  
  8. [root@jie1 ~]# sed -i 's/IPADDR/ip/w ip.txt' test  
  9.        #把sed操作的文件内容保存到另外一个文件中,w表示保存,ip.txt文件名  
  10. [root@jie1 ~]# cat ip.txt  #查看新文件的内容  
  11. ip=172.16.10.12  
  12. [root@jie1 ~]#  

2)读取一个文件到正在用sed操作的文件中

[java]  view plain  copy
 
  1. [root@jie1 ~]# cat myfile   #文件内容  
  2. hello world  
  3. i am li  
  4. how are you  
  5. li  
  6. [root@jie1 ~]# cat test  #将用sed操作的文件的内容  
  7. Ethernet  
  8. #BOOTPROTO="dhcp"  
  9. HWADDR="00:0C:29:90:79:78"  
  10. ONBOOT="yes"  
  11. IPADDR=172.16.10.12  
  12. NETMASK=255.255.0.0  
  13. [root@jie1 ~]# sed  -i '/Ethernet/r myfile' test  
  14.       #在匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后  
  15. [root@jie1 ~]# cat test  #再次查看用sed命令操作的行  
  16. Ethernet  
  17. hello world  
  18. i am li  
  19. how are you  
  20. li  
  21. #BOOTPROTO="dhcp"  
  22. HWADDR="00:0C:29:90:79:78"  
  23. ONBOOT="yes"  
  24. IPADDR=172.16.10.12  
  25. NETMASK=255.255.0.0  
  26. [root@jie1 ~]#  

sed的经典例子:

[java]  view plain  copy
 
  1. ##1)、处理以下文件内容,将域名取出并进行计数排序,如处理:  
  2. http://www.baidu.com/index.<a target="_blank" href="http://www.2cto.com/kf/qianduan/css/" class="keylink" style="border:none; padding:0px; margin:0px; color:rgb(51,51,51); text-decoration:none; font-size:14px">html</a>  
  3. http://www.baidu.com/1.html  
  4. http://post.baidu.com/index.html  
  5. http://mp3.baidu.com/index.html  
  6. http://www.baidu.com/3.html  
  7. http://post.baidu.com/2.html  
  8. 得到如下结果:  
  9. 域名的出现的次数 域名  
  10. 3 www.baidu.com  
  11. 2 post.baidu.com  
  12. 1 mp3.baidu.com  
  13. [root@localhost shell]# cat file | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn  
  14. 3 www.baidu.com  
  15. 2 post.baidu.com  
  16. 1 mp3.baidu.com  
  17. [root@codfei4 shell]# awk -F/ '{print $3}' file |sort -r|uniq -c|awk '{print $1"\t",$2}'  
  18. 3 www.baidu.com  
  19. 2 post.baidu.com  
  20. 1 mp3.baidu.com  
  21. ##2)、用grep结合sed取出网卡的ip地址  
  22. [root@jie1 ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e 'N;s/eth[09].*\n.*addr:[09]{1,3}\.[09]{1,3}\.[09]{1,3}\.[09]{1,3}.*/\1 \2/p'  

学会sed的使用是写自动化shell脚本的基础,sed也是一个非常有用且重要的命令,是文本处理工具之一,以上是我自己学习总结的sed命令简单的用法,sed还有更高级的用法,也还在学习中。



awk于1977年出生,今年36岁本命年,sed比awk大2-3岁,awk就像林妹妹,sed就是宝玉哥哥了。所以 林妹妹跳了个Topless,他的哥哥sed坐不住了,也一定要出来抖一抖。

sed全名叫stream editor,流编辑器,用程序的方式来编辑文本,相当的hacker啊。sed基本上就是玩正则模式匹配,所以,玩sed的人,正则表达式一般都比较强。

同样,本篇文章不会说sed的全部东西,你可以参看sed的手册,我这里主要还是想和大家竞争一下那些从手机指缝间或马桶里流走的时间,用这些时间来学习一些东西。当然,接下来的还是要靠大家自己双手。

用s命令替换

我使用下面的这段文本做演示:

1
2
3
4
5
6
7
8
9
$ cat pets.txt
This is my cat
   my cat 's name is betty
This is my dog
   my dog's name is frank
This is my fish
   my fish's name is george
This is my goat
   my goat's name is adam

把其中的my字符串替换成Hao Chen’s,下面的语句应该很好理解(s表示替换命令,/my/表示匹配my,/Hao Chen’s/表示把匹配替换成Hao Chen’s,/g 表示一行上的替换所有的匹配):

1
2
3
4
5
6
7
8
9
$ sed "s/my/Hao Chen's/g" pets.txt
This is Hao Chen's cat
   Hao Chen 's cat' s name is betty
This is Hao Chen's dog
   Hao Chen 's dog' s name is frank
This is Hao Chen's fish
   Hao Chen 's fish' s name is george
This is Hao Chen's goat
   Hao Chen 's goat' s name is adam

注意:如果你要使用单引号,那么你没办法通过\’这样来转义,就有双引号就可以了,在双引号内可以用\”来转义。

再注意:上面的sed并没有对文件的内容改变,只是把处理过后的内容输出,如果你要写回文件,你可以使用重定向,如:

1
$ sed "s/my/Hao Chen's/g" pets.txt > hao_pets.txt

或使用 -i 参数直接修改文件内容:

1
$ sed -i "s/my/Hao Chen's/g" pets.txt

在每一行最前面加点东西:

1
2
3
4
5
6
7
8
9
$ sed 's/^/#/g' pets.txt
#This is my cat
#  my cat's name is betty
#This is my dog
#  my dog's name is frank
#This is my fish
#  my fish's name is george
#This is my goat
#  my goat's name is adam

在每一行最后面加点东西:

1
2
3
4
5
6
7
8
9
$ sed 's/$/ --- /g' pets.txt
This is my cat ---
   my cat 's name is betty ---
This is my dog ---
   my dog's name is frank ---
This is my fish ---
   my fish's name is george ---
This is my goat ---
   my goat's name is adam ---

顺手介绍一下正则表达式的一些最基本的东西:

  • ^ 表示一行的开头。如:/^#/ 以#开头的匹配。
  • $ 表示一行的结尾。如:/}$/ 以}结尾的匹配。
  • \< 表示词首。 如 \<abc 表示以 abc 为首的詞。
  • \> 表示词尾。 如 abc\> 表示以 abc 結尾的詞。
  • . 表示任何单个字符。
  • * 表示某个字符出现了0次或多次。
  • [ ] 字符集合。 如:[abc]表示匹配a或b或c,还有[a-zA-Z]表示匹配所有的26个字符。如果其中有^表示反,如[^a]表示非a的字符

正规则表达式是一些很牛的事,比如我们要去掉某html中的tags:

html.txt
1
< b >This</ b > is what < span style = "text-decoration: underline;" >I</ span > meant. Understand?

看看我们的sed命令

1
2
3
4
5
6
7
8
# 如果你这样搞的话,就会有问题
$ sed 's/<.*>//g' html.txt
  Understand?
 
# 要解决上面的那个问题,就得像下面这样。
# 其中的'[^>]' 指定了除了>的字符重复0次或多次。
$ sed 's/<[^>]*>//g' html.txt
This is what I meant. Understand?

我们再来看看指定需要替换的内容:

1
2
3
4
5
6
7
8
9
$ sed "3s/my/your/g" pets.txt
This is my cat
   my cat 's name is betty
This is your dog
   my dog's name is frank
This is my fish
   my fish's name is george
This is my goat
   my goat's name is adam

下面的命令只替换第3到第6行的文本。

1
2
3
4
5
6
7
8
9
$ sed "3,6s/my/your/g" pets.txt
This is my cat
   my cat 's name is betty
This is your dog
   your dog's name is frank
This is your fish
   your fish's name is george
This is my goat
   my goat's name is adam

 

1
2
3
4
5
$ cat my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
This is my goat, my goat's name is adam

只替换每一行的第一个s:

1
2
3
4
5
$ sed 's/s/S/1' my.txt
ThiS is my cat , my cat 's name is betty
ThiS is my dog, my dog's name is frank
ThiS is my fish, my fish's name is george
ThiS is my goat, my goat's name is adam

只替换每一行的第二个s:

1
2
3
4
5
$ sed 's/s/S/2' my.txt
This iS my cat , my cat 's name is betty
This iS my dog, my dog's name is frank
This iS my fish, my fish's name is george
This iS my goat, my goat's name is adam

只替换第一行的第3个以后的s:

1
2
3
4
5
$ sed 's/s/S/3g' my.txt
This is my cat , my cat 'S name iS betty
This is my dog, my dog'S name iS frank
This is my fiSh, my fiSh'S name iS george
This is my goat, my goat'S name iS adam
多个匹配

如果我们需要一次替换多个模式,可参看下面的示例:(第一个模式把第一行到第三行的my替换成your,第二个则把第3行以后的This替换成了That)

1
2
3
4
5
$ sed '1,3s/my/your/g; 3,$s/This/That/g' my.txt
This is your cat , your cat 's name is betty
This is your dog, your dog's name is frank
That is your fish, your fish's name is george
That is my goat, my goat's name is adam

上面的命令等价于:(注:下面使用的是sed的-e命令行参数)

1
sed -e '1,3s/my/your/g' -e '3,$s/This/That/g' my.txt

我们可以使用&来当做被匹配的变量,然后可以在基本左右加点东西。如下所示:

1
2
3
4
5
$ sed 's/my/[&]/g' my.txt
This is [my] cat , [my] cat 's name is betty
This is [my] dog, [my] dog's name is frank
This is [my] fish, [my] fish's name is george
This is [my] goat, [my] goat's name is adam
圆括号匹配

使用圆括号匹配的示例:(圆括号括起来的正则表达式所匹配的字符串会可以当成变量来使用,sed中使用的是\1,\2…)

1
2
3
4
5
$ sed 's/This is my \([^,]*\),.*is \(.*\)/\1:\2/g' my.txt
cat :betty
dog:frank
fish:george
goat:adam

上面这个例子中的正则表达式有点复杂,解开如下(去掉转义字符):

正则为:This is my ([^,]*),.*is (.*)
匹配为:This is my (cat),……….is (betty)

然后:\1就是cat,\2就是betty

sed的命令

让我们回到最一开始的例子pets.txt,让我们来看几个命令:

N命令

先来看N命令 —— 把下一行的内容纳入当成缓冲区做匹配。

下面的的示例会把原文本中的偶数行纳入奇数行匹配,而s只匹配并替换一次,所以,就成了下面的结果:

1
2
3
4
5
6
7
8
9
$ sed 'N;s/my/your/' pets.txt
This is your cat
   my cat 's name is betty
This is your dog
   my dog's name is frank
This is your fish
   my fish's name is george
This is your goat
   my goat's name is adam

也就是说,原来的文件成了:

1
2
3
4
This is my cat \n  my cat 's name is betty
This is my dog\n  my dog's name is frank
This is my fish\n  my fish's name is george
This is my goat\n  my goat's name is adam

这样一来,下面的例子你就明白了,

1
2
3
4
5
$ sed 'N;s/\n/,/' pets.txt
This is my cat ,  my cat 's name is betty
This is my dog,  my dog's name is frank
This is my fish,  my fish's name is george
This is my goat,  my goat's name is adam
a命令和i命令

a命令就是append, i命令就是insert,它们是用来添加行的。如:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 其中的1i表明,其要在第1行前插入一行(insert)
$ sed "1 i This is my monkey, my monkey's name is wukong" my.txt
This is my monkey, my monkey's name is wukong
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
This is my goat, my goat's name is adam
 
# 其中的1a表明,其要在最后一行后追加一行(append)
$ sed "$ a This is my monkey, my monkey's name is wukong" my.txt
This is my cat , my cat 's name is betty
This is my monkey, my monkey's name is wukong
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
This is my goat, my goat's name is adam

我们可以运用匹配来添加文本:

1
2
3
4
5
6
7
# 注意其中的/fish/a,这意思是匹配到/fish/后就追加一行
$ sed "/fish/a This is my monkey, my monkey's name is wukong" my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
This is my monkey, my monkey's name is wukong
This is my goat, my goat's name is adam

下面这个例子是对每一行都挺插入:

1
2
3
4
5
6
7
8
9
$ sed "/my/a ----" my.txt
This is my cat , my cat 's name is betty
----
This is my dog, my dog's name is frank
----
This is my fish, my fish's name is george
----
This is my goat, my goat's name is adam
----
c命令

c 命令是替换匹配行

1
2
3
4
5
6
7
8
9
10
11
$ sed "2 c This is my monkey, my monkey's name is wukong" my.txt
This is my cat , my cat 's name is betty
This is my monkey, my monkey's name is wukong
This is my fish, my fish's name is george
This is my goat, my goat's name is adam
 
$ sed "/fish/c This is my monkey, my monkey's name is wukong" my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my monkey, my monkey's name is wukong
This is my goat, my goat's name is adam
d命令

删除匹配行

1
2
3
4
5
6
7
8
9
10
11
12
$ sed '/fish/d' my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my goat, my goat's name is adam
 
$ sed '2d' my.txt
This is my cat , my cat 's name is betty
This is my fish, my fish's name is george
This is my goat, my goat's name is adam
 
$ sed '2,$d' my.txt
This is my cat , my cat 's name is betty
p命令

打印命令

你可以把这个命令当成grep式的命令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 匹配fish并输出,可以看到fish的那一行被打了两遍,
# 这是因为sed处理时会把处理的信息输出
$ sed '/fish/p' my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
This is my fish, my fish's name is george
This is my goat, my goat's name is adam
 
# 使用n参数就好了
$ sed -n '/fish/p' my.txt
This is my fish, my fish's name is george
 
# 从一个模式到另一个模式
$ sed -n '/dog/,/fish/p' my.txt
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
 
#从第一行打印到匹配fish成功的那一行
$ sed -n '1,/fish/p' my.txt
This is my cat , my cat 's name is betty
This is my dog, my dog's name is frank
This is my fish, my fish's name is george
几个知识点

好了,下面我们要介绍四个sed的基本知识点:

Pattern Space

第零个是关于-n参数的,大家也许没看懂,没关系,我们来看一下sed处理文本的伪代码,并了解一下Pattern Space的概念:

1
2
3
4
5
6
7
8
9
10
11
12
foreach line in file {
     //放入把行Pattern_Space
     Pattern_Space <= line;
 
     // 对每个pattern space执行sed命令
     Pattern_Space <= EXEC(sed_cmd, Pattern_Space);
 
     // 如果没有指定 -n 则输出处理后的Pattern_Space
     if (sed option hasn't "-n" )  {
        print Pattern_Space
     }
}
Address

第一个是关于address,几乎上述所有的命令都是这样的(注:其中的!表示匹配成功后是否执行命令)

[address[,address]][!]{cmd}

address可以是一个数字,也可以是一个模式,你可以通过逗号要分隔两个address 表示两个address的区间,参执行命令cmd,伪代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
bool bexec = false
foreach line in file {
     if ( match(address1) ){
         bexec = true ;
     }
 
     if ( bexec == true ) {
         EXEC(sed_cmd);
     }
 
     if ( match (address2) ) {
         bexec = false ;
     }
}

关于address可以使用相对位置,如:

1
2
3
4
5
6
7
8
9
10
# 其中的+3表示后面连续3行
$ sed '/dog/,+3s/^/# /g' pets.txt
This is my cat
   my cat 's name is betty
# This is my dog
#   my dog's name is frank
# This is my fish
#   my fish's name is george
This is my goat
   my goat's name is adam
命令打包

第二个是cmd可以是多个,它们可以用分号分开,可以用大括号括起来作为嵌套命令。下面是几个例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
$ cat pets.txt
This is my cat
   my cat 's name is betty
This is my dog
   my dog's name is frank
This is my fish
   my fish's name is george
This is my goat
   my goat's name is adam
 
# 对3行到第6行,执行命令/This/d
$ sed '3,6 {/This/d}' pets.txt
This is my cat
   my cat 's name is betty
   my dog's name is frank
   my fish's name is george
This is my goat
   my goat's name is adam
 
# 对3行到第6行,匹配/This/成功后,再匹配/fish/,成功后执行d命令
$ sed '3,6 {/This/{/fish/d}}' pets.txt
This is my cat
   my cat 's name is betty
This is my dog
   my dog's name is frank
   my fish's name is george
This is my goat
   my goat's name is adam
 
# 从第一行到最后一行,如果匹配到This,则删除之;如果前面有空格,则去除空格
$ sed '1,${/This/d;s/^ *//g}' pets.txt
my cat 's name is betty
my dog's name is frank
my fish's name is george
my goat's name is adam
Hold Space

第三个我们再来看一下 Hold Space

接下来,我们需要了解一下Hold Space的概念,我们先来看四个命令:

g: 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除
G: 将hold space中的内容append到pattern space\n后
h: 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除
H: 将pattern space中的内容append到hold space\n后
x: 交换pattern space和hold space的内容

这些命令有什么用?我们来看两个示例吧,用到的示例文件是:

1
2
3
4
$ cat t.txt
one
two
three

第一个示例:

1
2
3
4
5
6
7
8
9
$ sed 'H;g' t.txt
one
 
one
two
 
one
two
three

是不是有点没看懂,我作个图你就看懂了。

第二个示例,反序了一个文件的行:

1
2
3
4
$ sed '1!G;h;$!d' t.txt
three
two
one

其中的 ‘1!G;h;$!d’ 可拆解为三个命令

  • 1!G —— 只有第一行不执行G命令,将hold space中的内容append回到pattern space
  • h —— 第一行都执行h命令,将pattern space中的内容拷贝到hold space中
  • $!d —— 除了最后一行不执行d命令,其它行都执行d命令,删除当前行

这个执行序列很难理解,做个图如下大家就明白了:

就先说这么多吧,希望对大家有用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值