1.介绍
- sed是一种流编辑器,它是文本处理中非常重要的工具,能够完美的配合正则表达式使用,功能不同凡响。
- sed主要用来自动编辑一个或多个文件,并简单对文件进行反复操作,编写转换程序等。
- sed默认按照Basic规范基本匹配。
2.工作方式
在处理文件时,将当前处理的行存储在临时缓冲区中,称为“模式空间(pattern space)”,接着用sed命令处理缓冲区中的内容,处理完成之后,将缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。
注意:这样处理的文件内容并没有改变,除非我们使用重定向存储输出。
3.命令格式
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
4.常见基本使用
- /pattern/p:打印匹配pattern的行
- /pattern/d:删除匹配pattern的行
删除代码中所有的printf语句
- /pattern/s/pattern1/pattern2/:查找符合pattern的行,将该行第一个匹配pattern1的字符串替换为pattern2
使用sed,注释代码中的所有printf
- /pattern/s/pattern1/pattern2/g:查找符合pattern的行,将该行所有匹配pattern1的字符串替换为pattern2
带g或者不带g有什么区别呢?来看下面的例子
其中,&表示可以匹配pattern1之后的所有字符,如下例
\(..\)用于匹配子串,匹配到的第一个子串就标记为\1,以此类推,第二个就是\2,通过这种方式,可以完成数据逆置,如下例
- 定址:用于决定对哪些进行编辑。
其中,地址形式可以是数字、正则表达式、二者结合。如果没有指定地址,sed将处理输入文件的所有行
- 退出状态:sed和grep不同,不管是否找到指定的模式,它的退出状态都是0。只有当命令存在语法错误时,sed的退出状态才不是0。
- /pattern/d:删除匹配pattern的行
5.模式空间&保持空间
- 模式空间(pattern space):可以想象成工程里面的流水线,数据直接在它上面进行处理。
- 保持空间(hold space):可以想象成仓库,我们在进行数据处理时,作为数据的暂存区域。
注意:在正常情况下,如果不使用某些高级命令,保持空间不会使用到!
- sed在正常情况下,将处理的行读入模式空间,脚本中的sed命令,一条接着一条进行处理,直至话本执行完毕,然后输出,模式空间被清空;接着,在重复执行刚才的动作,文件的新的一行被读入,直到文件被处理完毕。
6.sed高级命令
- g:将保持空间中的内容拷贝到模式空间中,原来的模式空间里面的内容被清除
- G:将保持空间的内容添加到模式空间\n后
- h:将模式空间里面的内容拷贝至保持空间中,原来的保持空间内容被清除
- H:将模式空间中的内容添加到保持空间\n后
- d:删除模式空间中的所有行,并读入到下一新行的模式空间中
- D:删除模式空间中的新的一行,不读入下一行
- x:交换保持空间和模式空间的内容
- N:将下一行添加到模式空间中
- n:读取下一行到模式空间
下面来看几个例子
- 用sed模拟出tac的功能(倒序输出)
- 追加匹配行到文件结尾
- 行列转换
- 打印奇偶数行
- 1~100的求和