Linux命令 之 sed(二)

Sed是一个非交互性上下文编辑器,它被设计用来在以下环境中发挥作用:

1.    可以直接操作或编辑那些对常规编辑器而言太大的文件。相信很多人都有过打打开一个大文件会拖死你的电脑的情况;

2.    编辑命令太复杂(windows上貌似不存在这种情况,用命令行的linux就难说了)很难以在交互模式下编辑文件;

3.    要在对输入的一趟扫描中有效的进行多个‘全局’(global)编辑函数

在开始介绍sed的控制符与语法之前,先概述几个概念:

  • 四个空间:input stream, pattern buffer, output stream 和 hold buffer
  • 基本操作过程:将 input stream 的当前行放入 pattern buffer, 然后 input stream 的指针指向下一行 ;对 pattern buffer 中的行进行处理 ;将上面的处理结果放入 output stream. 然后循环这个过程 .
  • hold buffer 是另一个空间 , 可以通过命令和 pattern buffer 进行交互 .

Sed命令介绍:

一、 基本命令:字符串替换’s’

1.    基本用法
    e.g.  sed ‘s/day/night/’ <old >new
    该例子将文件 old 中的每一行第一次出现的 day 替换成 night, 将结果输出到文件 new
    对上述例子的说明:

    s   表示替换命令 
    /../../ 分割符 (Delimiter),第一个/../表示要搜索的字符或正则表达式,也就是上面例子中的’day’;
    第二个/../表示要用来替换的字符串,也就是上面例子中的’night’

    注意,与正则表达式的界定符类似,也可以采用其它符号作为s命令分割符不论什么字符,紧跟着s命令的都被认为是分隔符,如 sed ’s#aaa#bbb#g’,即采用#作为分割符。

2.    用 & 表示匹配的字符串
    有时可能会想在匹配到的字符串周围或附近加上一些其它的字符,那么可以像下面这样来操作:
    sed ‘s/abc/(abc)/’ <old >new
    该例子从old文件中读取字符,在找到的 abc 前后加上括号,然后协会到文件new。该例子还可以写成
    sed ‘s/abc/(&)/’ <old >new     #效果和上面的一样
    下面是更复杂的例子 :
    sed ‘s/[a-z]*/(&)/’ <old >new
    sed ‘s/[0-9]*/& &/’ <old >new

3.    用 /1, /2, …, /9 来表示匹配的字符串
   先看个例子:
   sed ‘s//([a-z]*/)[0-9]*//1/’ <old >new      #本例中 /1 就是指前面的 /([a-z]*/)
   #如果在old文件中有内容:abc123 abc123那么在new文件中将会是:abc abc

   /1, /2, …, /9 也可以出现在搜索字符串中,例如:
   sed ‘s//([a-z]*/) /1//1/’ <old >new    #本例可以去除重复的由字母组成的词
4.   替换选项
  4.1  /g 替换所有的
      sed 默认只替换搜索字符串的第一次出现 , 利用 /g 可以替换搜索字符串所有出现的地方, 例如:
      sed ‘s//([^ ]*/)/(&)/g’ <old >new
  4.2  用 /1, /2, … 来表明替换哪一次出现
      sed ‘s/[^ ]*//2′ <old >new     #替换搜索到的第二次出现,可以从 /1 用到 /512
  4.3  /p print 选项
      当 sed 命令有 -n 选项时 , 该命令没有输出,例如,
      sed -n ‘s//([a-z]*/)[0-9]*//1/’ <old     #如果old中包含内容:abc123,如果没有-n选项,则输出abc;有-n则不输出
      但是如果-n 配合 /p 选项后, 如果该行确实发生了替换 , 则输出该行, 否则不输出。
  4.4 ‘/w filename’ 输出写到文件 filename 中
      sed ‘s//([0-9]*/) /([a-z]*/)//2/w new’ <old
      该例子把输出放入文件 new 中

5.   替换和插入换行符号
   替换 (echo a;echo x;echo y) | sed ‘/x$/ {
   N
   s:x/n:x:
   }’
   上面的脚本输出:
   a
   xy
   插入 
   (echo a;echo x;echo y) | sed ‘s:x:X/
   :’
   这条语句结果为:
   a
   x y

   sed ‘s//([^ ]*/)/(&)/g’ <old >newsed ‘s//([^ ]*/)/(&)/g’ <old >new

二、只对特定行的处理

1.    通过行号限定

   sed ‘s/[0-9][0-9]*//’ <old >new   只处理第 3 行

   sed ’1,100 s/A/a/’ <old >new       只处理 1 到 100 行
   sed ’101,$ s/A/a/’ <old >new       处理 101 到文件的最后一行
   sed ’101,$ !s/A/a/’ <old >new       这里 ! 表示只对 1 到 100 行进行替换 ,! 的作用是取反

2.   通过正规表达式限定

   sed ‘/start/,/stop/ s/#.*//’ <old >new
   本例中 ,sed 先找到有 start 的行作为开始 , 找到最近的有 stop 的行作为结束 , 对之间的行进行操作,重复上述过程 ,直到文件结束。

   下面这个例子是行号和正规表达式配合来限定:
   sed ’1,/start/ s/#.*//’ <old >new      对第 1 行到含有 start 的行进行处理

三、其他的简单命令

1.    删除命令 d
    sed ’11,$ d’ <old >new       删除从 11 行到文件末尾
    sed ‘/^#/ d’ <old >new         删除所有以 # 开始的行

2.    print 命令 p (注意 与上面提到的和 s 命令结合使用的 /p 选项的区别)
    sed ‘p’ <old       每一行将会被输出两次 
    sed -n ‘p’ <old       每一行将会输出一次 (-n 屏蔽掉一次 )
    sed ‘/^$/ p’ <old      只对空行输出两次 , 其他只输出一次 
    sed -n ’1,10 p’ <old       输出前 10 行 
    sed -n ‘/match/ p’ <old     输出含有 match 的行

3.    quit 命令 q
    sed ’11 q’<old      输出前 10 行 ( 在第 11 行退出 )
    注意 :q 命令不能接收多行 , 例如:sed ’2,5 q’<old     是不正确的

4.    写入文件命令 w  filename( 注意与 s 命令的 /w 选项的区别 )
    sed -n ‘/^[0-9]*[02468]/ w even’ <old     将以偶数开始的行写入文件 even

5.    输出行号命令 =
    sed -n ‘/PATTERN/ =’ <old     遇到含有 PATTERN 的行时 , 同时输出行号

6.   追加 , 改变 , 插入新行

  追加命令 a
    #!/bin/sh
    sed ‘
    /WORD/ a/
    Add this line after every line with WORD
    ‘
  改变命令 c
    #!/bin/sh
    sed ‘
    /WORD/ c/
    Replace the current line with the line
    ‘
  插入命令 i
    #!/bin/sh
    sed ‘
    /WORD/ i/
    Add this line before every line with WORD
    ‘

7.    变换命令 y
    sed ‘y/abcdef/ABCDEF/’ <old      该例将字符 abcdef 分别变成大写

8.    将本行的控制符也显示出来的命令  l
    sed ’1,10 l’ <old

9.    d 命令和 D 命令
    d 命令删除 pattern buffer 中的内容进入下一次操作循环 
    D 命令删除 pattern buffer 中第一个换行符之前的内容进入下一次操作循环 , 如果 pattern buffer 中还有内容, 则不用从 input stream 中读入。

10.  p 命令和 P 命令
    p 命令输出 pattern buffer 中的内容 
    P 命令输出 pattern buffer 中第一个换行符之前的内容

11.  n 命令和 N 命令
    n 命令把下一行读入 pattern buffer 中 ( 如果没用 -n 选项 , 将原来行输出 )
    N 命令把下一行追加到 pattern buffer 中

12.  流程控制命令
    b label 命令 : 在指定行跳到 label
    t label 命令 : 如果在某行发生了替换 , 跳到 label
    T label 命令 : 如果在某行没有发生了替换 , 跳到 label

四、调用 sed 时的参数

1.    -e script    执行 script 这个脚本
    e.g.  sed -e ‘s/a/A/’ -e ‘s/b/B/’ <old >new
    对每一行分别执行 ‘s/a/A/’ 和 ‘s/b/B/’

2.    -n    禁止输出
    这里的 -n 与前面的 /p 配合 , 可以只输出被修改了的行

3.   -f scriptname 
    把 scriptname 文件中的 sed 命令加入本次 sed 的调用中 
   e.g. sed -f sedscript <old >new
    sedscript 的内容可能是这样的:
    # sed comment – This script changes lower case vowels to upper case
    s/a/A/g
    s/e/E/g
    s/i/I/g
    s/o/O/g
    s/u/U/g

五、Hold Buffer
    x 命令 : 将 pattern buffer 放入 hold buffer, 而将 hold buffer 的内容输出 , pattern buffer 的内容变成下一行 
    h 命令 : 将 pattern buffer 放入 hold buffer, 并将 pattern buffer 的内容输出, pattern buffer 的内容变成下一行 
    H 命令 : 将 pattern buffer 追加到 hold buffer
    g 和 G 命令 :g 用 hold buffer 的内容替换 pattern buffer 的内容 , 而 G 将 hold buffer 内容追加到 pattern buffer


 更多参考,http://sed.sourceforge.net/sed1line_zh-CN.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值