sed:文件流编辑器,可以对匹配内容进行改动,并显示在屏幕上,源文件不改动,当然也可以选择改动源文件。
格式:
sed [选项] 'command' file(s)
sed [选项] -f scriptfile file(s)
选项:
-e<script>或--expression=<script>:以选项中的指定的script来处理输入的文本文件;
-f<script文件>或--file=<script文件>:以选项中指定的script文件来处理输入的文本文件;
-h或--help:显示帮助;
-n或--quiet或——silent:仅显示script处理后的结果,一般配合动作命令p使用。
-V或--version:显示版本信息。
command的命令(摘自linux 命令大全):
a\ 在当前行下面插入文本。
i\ 在当前行上面插入文本。
c\ 把选定的行改为新的文本。
d 删除,删除选择的行。
D 删除模板块的第一行。
s 替换指定字符
h 拷贝模板块的内容到内存中的缓冲区。
H 追加模板块的内容到内存中的缓冲区。
g 获得内存缓冲区的内容,并替代当前模板块中的文本。
G 获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l 列表不能打印字符的清单。
n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p 打印模板块的行。
P(大写) 打印模板块的第一行。
q 退出Sed。
b lable 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
r file 从file中读行。
t label if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label 错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
w file 写并追加模板块到file末尾。
W file 写并追加模板块的第一行到file末尾。
! 表示后面的命令对所有没有被选定的行发生作用。
= 打印当前行号码。
# 把注释扩展到下一个换行符以前。
标记:
g 表示行内全面替换。
p 表示打印行。
w 表示把行写入一个文件。
x 表示互换模板块中的文本和缓冲区中的文本。
y 表示把一个字符翻译为另外的字符(但是不用于正则表达式)
\1 子串匹配标记
& 已匹配字符串标记
正则字符集:
^ 匹配行开始,如:/^sed/匹配所有以sed开头的行。
$ 匹配行结束,如:/sed$/匹配所有以sed结尾的行。
. 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d。
* 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。
[] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed。
[^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。
.... 匹配子串,保存匹配的字符,如s/loveloveable/\1rs,loveable被替换成lovers。
& 保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。
\< 匹配单词的开始,如:/\<love/匹配包含以love开头的单词的行。
\> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行。
x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的行。
x\{m,\} 重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行。
x\{m,n\} 重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行。
基本用法:
salary.txt内容,全程,简称,日期,工资:
lin sam,sam,2012-01-11,1000
Li Tom,Tom,2012-01-11,2000
Zhou John,John,2012-01-13,3000
lin sam,sam,2012-01-11,2000
Li Tom,Tom,2013-01-20,3000
Zhou John,John,2013-01-28,4000
替换:
把sam替换成Sam(不改变源文件)
sed 's/sam/Sam/' salary.txt #替换每行第一个sam
sed 's/sam/Sam/g' salary.txt #替换每行所有的sam
上面打印所有文本,若只打印发生替换的行,用-n和p命令
sed -n 's/sam/Sam/gp' salary.txt
若要改变源文件,加-i
sed -i 's/sam/Sam/g' salary.txt #把源文件的所有sam替换成Sam
只改变指定的行
sed '1,3 s/000/111/g' salary.txt #第一到第三行的000替换成111
每行从第2处匹配开始替换
sed 's/sam/Sam/2g' salary.txt
将第2~4行 替换成 "new 2-4 lines"
sed '2,4c new 2-4 lines' salary.txt
删除:
sed '2,4d' salary.txt #删2~4行
sed '4,$d' salary.txt #删第4到最后一行
sed '/^$/d' salary.txt #删除空白行
sed '/^lin/d' salary.txt #删除以lin开头的行
sed '/sam/,/Tom/d' salary.txt #删除 包含sam行 到 包含Tom行 之间的所有行
添加
sed '2a new line' salary.txt #在第2行后面添加
sed '2i new line' salary.txt #在第2行前面插入
添加多行,在第2行前面插入两行new line 和 new line2
sed '2i new line\
> new line2' salary.txt
定界符
习惯了用/作为定界符,也可以用其他符号
sed 's:sam:Sam:g' salary.txt #以:作为定界符
sed 's~sam~Sam~g' salary.txt #以~作为定界符
匹配字符串
匹配到的字符串用 & 代替,&代表的所有匹配到的字符串,\<s匹配的单词开始
sed 's/\<s\w*/{&}/g' salary.txt #以s开头的单词用{&}代替
子字符串匹配
\(..\) 用于匹配子串,\n表示第n个匹配到子字符串,\1表示第一个匹配到的
sed 's/\(\w*\) \(\w*\)/\2 \1/' salary.txt #把第一个匹配到的\w*\ 跟第一个交换了一下位置
脚本
把上面的命令写入sedScript:
s/\(\w*\) \(\w*\)/\2 \1/
运行:
sed -f sedscript salary.txt
得到同样的效果