linunx sed 文本流编辑

sed:文件流编辑器,可以对匹配内容进行改动,并显示在屏幕上,源文件不改动,当然也可以选择改动源文件。

格式:

sed [选项] 'command' file(s)
sed [选项] -f scriptfile file(s)

选项:

-e<script>或--expression=<script>:以选项中的指定的script来处理输入的文本文件;
-f<script文件>或--file=<script文件>:以选项中指定的script文件来处理输入的文本文件;
-h或--help:显示帮助;
-n或--quiet或——silent:仅显示script处理后的结果,一般配合动作命令p使用。
-V或--version:显示版本信息。

command的命令(摘自linux 命令大全):

a\ 在当前行下面插入文本。
i\ 在当前行上面插入文本。
c\ 把选定的行改为新的文本。
d 删除,删除选择的行。
D 删除模板块的第一行。
s 替换指定字符
h 拷贝模板块的内容到内存中的缓冲区。
H 追加模板块的内容到内存中的缓冲区。
g 获得内存缓冲区的内容,并替代当前模板块中的文本。
G 获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l 列表不能打印字符的清单。
n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N 追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p 打印模板块的行。
P(大写) 打印模板块的第一行。
q 退出Sed。
b lable 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
r file 从file中读行。
t label if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label 错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
w file 写并追加模板块到file末尾。  
W file 写并追加模板块的第一行到file末尾。  
! 表示后面的命令对所有没有被选定的行发生作用。  
= 打印当前行号码。  
# 把注释扩展到下一个换行符以前。  

标记:

g 表示行内全面替换。  
p 表示打印行。  
w 表示把行写入一个文件。  
x 表示互换模板块中的文本和缓冲区中的文本。  
y 表示把一个字符翻译为另外的字符(但是不用于正则表达式)
\1 子串匹配标记
& 已匹配字符串标记

正则字符集:

^ 匹配行开始,如:/^sed/匹配所有以sed开头的行。  
$ 匹配行结束,如:/sed$/匹配所有以sed结尾的行。  
. 匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d。  
* 匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。 
[] 匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed。   
[^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。 
.... 匹配子串,保存匹配的字符,如s/loveloveable/\1rs,loveable被替换成lovers。 
& 保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。  
\< 匹配单词的开始,如:/\<love/匹配包含以love开头的单词的行。  
\> 匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行。  
x\{m\} 重复字符x,m次,如:/0\{5\}/匹配包含5个0的行。  
x\{m,\} 重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行。  
x\{m,n\} 重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行。 

基本用法:

salary.txt内容,全程,简称,日期,工资:

lin sam,sam,2012-01-11,1000
Li Tom,Tom,2012-01-11,2000
Zhou John,John,2012-01-13,3000
lin sam,sam,2012-01-11,2000
Li Tom,Tom,2013-01-20,3000
Zhou John,John,2013-01-28,4000

替换:

把sam替换成Sam(不改变源文件)

sed 's/sam/Sam/' salary.txt #替换每行第一个sam
sed 's/sam/Sam/g' salary.txt #替换每行所有的sam

上面打印所有文本,若只打印发生替换的行,用-n和p命令

sed -n 's/sam/Sam/gp' salary.txt  

若要改变源文件,加-i

sed -i 's/sam/Sam/g' salary.txt #把源文件的所有sam替换成Sam

只改变指定的行

sed '1,3 s/000/111/g' salary.txt #第一到第三行的000替换成111

每行从第2处匹配开始替换

sed 's/sam/Sam/2g' salary.txt

将第2~4行 替换成 "new 2-4 lines"

sed '2,4c new 2-4 lines' salary.txt

删除:

sed '2,4d' salary.txt #删2~4行
sed '4,$d' salary.txt #删第4到最后一行
sed '/^$/d' salary.txt #删除空白行
sed '/^lin/d' salary.txt #删除以lin开头的行
sed '/sam/,/Tom/d' salary.txt #删除 包含sam行 到 包含Tom行 之间的所有行

添加

sed '2a new line' salary.txt #在第2行后面添加
sed '2i new line' salary.txt #在第2行前面插入

添加多行,在第2行前面插入两行new line 和 new line2

sed '2i new line\
> new line2' salary.txt

定界符

习惯了用/作为定界符,也可以用其他符号

sed 's:sam:Sam:g' salary.txt #以:作为定界符
sed 's~sam~Sam~g' salary.txt #以~作为定界符

匹配字符串

匹配到的字符串用 & 代替,&代表的所有匹配到的字符串,\<s匹配的单词开始

sed 's/\<s\w*/{&}/g' salary.txt #以s开头的单词用{&}代替

子字符串匹配

\(..\) 用于匹配子串,\n表示第n个匹配到子字符串,\1表示第一个匹配到的

sed 's/\(\w*\) \(\w*\)/\2 \1/' salary.txt #把第一个匹配到的\w*\ 跟第一个交换了一下位置
脚本

把上面的命令写入sedScript:

s/\(\w*\) \(\w*\)/\2 \1/

运行:

sed -f sedscript salary.txt
得到同样的效果
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值