linunx sed 文本流编辑

最新推荐文章于 2024-07-19 11:39:12 发布

啊_sam

最新推荐文章于 2024-07-19 11:39:12 发布

阅读量493

点赞数

CC 4.0 BY-SA版权

分类专栏： linux shell

本文链接：https://blog.csdn.net/A_sam/article/details/80713500

linux shell 专栏收录该内容

3 篇文章

订阅专栏

sed：文件流编辑器，可以对匹配内容进行改动，并显示在屏幕上，源文件不改动，当然也可以选择改动源文件。

格式：

sed [选项] 'command' file(s)
sed [选项] -f scriptfile file(s)

选项：

-e<script>或--expression=<script>：以选项中的指定的script来处理输入的文本文件；
-f<script文件>或--file=<script文件>：以选项中指定的script文件来处理输入的文本文件；
-h或--help：显示帮助；
-n或--quiet或——silent：仅显示script处理后的结果，一般配合动作命令p使用。
-V或--version：显示版本信息。

command的命令（摘自linux 命令大全）：

a\ 在当前行下面插入文本。
i\ 在当前行上面插入文本。
c\ 把选定的行改为新的文本。
d 删除，删除选择的行。
D 删除模板块的第一行。
s 替换指定字符
h 拷贝模板块的内容到内存中的缓冲区。
H 追加模板块的内容到内存中的缓冲区。
g 获得内存缓冲区的内容，并替代当前模板块中的文本。
G 获得内存缓冲区的内容，并追加到当前模板块文本的后面。
l 列表不能打印字符的清单。
n 读取下一个输入行，用下一个命令处理新的行而不是用第一个命令。
N 追加下一个输入行到模板块后面并在二者间嵌入一个新行，改变当前行号码。
p 打印模板块的行。
P(大写) 打印模板块的第一行。
q 退出Sed。
b lable 分支到脚本中带有标记的地方，如果分支不存在则分支到脚本的末尾。
r file 从file中读行。
t label if分支，从最后一行开始，条件一旦满足或者T，t命令，将导致分支到带有标号的命令处，或者到脚本的末尾。
T label 错误分支，从最后一行开始，一旦发生错误或者T，t命令，将导致分支到带有标号的命令处，或者到脚本的末尾。
w file 写并追加模板块到file末尾。  
W file 写并追加模板块的第一行到file末尾。  
! 表示后面的命令对所有没有被选定的行发生作用。  
= 打印当前行号码。  
# 把注释扩展到下一个换行符以前。

标记：

g 表示行内全面替换。  
p 表示打印行。  
w 表示把行写入一个文件。  
x 表示互换模板块中的文本和缓冲区中的文本。  
y 表示把一个字符翻译为另外的字符（但是不用于正则表达式）
\1 子串匹配标记
& 已匹配字符串标记

正则字符集：

^ 匹配行开始，如：/^sed/匹配所有以sed开头的行。  
$ 匹配行结束，如：/sed$/匹配所有以sed结尾的行。  
. 匹配一个非换行符的任意字符，如：/s.d/匹配s后接一个任意字符，最后是d。  
* 匹配0个或多个字符，如：/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。 
[] 匹配一个指定范围内的字符，如/[ss]ed/匹配sed和Sed。   
[^] 匹配一个不在指定范围内的字符，如：/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头，紧跟ed的行。 
.... 匹配子串，保存匹配的字符，如s/loveloveable/\1rs，loveable被替换成lovers。 
& 保存搜索字符用来替换其他字符，如s/love/**&**/，love这成**love**。  
\< 匹配单词的开始，如:/\<love/匹配包含以love开头的单词的行。  
\> 匹配单词的结束，如/love\>/匹配包含以love结尾的单词的行。  
x\{m\} 重复字符x，m次，如：/0\{5\}/匹配包含5个0的行。  
x\{m,\} 重复字符x，至少m次，如：/0\{5,\}/匹配至少有5个0的行。  
x\{m,n\} 重复字符x，至少m次，不多于n次，如：/0\{5,10\}/匹配5~10个0的行。

基本用法：

salary.txt内容，全程，简称，日期，工资：

lin sam,sam,2012-01-11,1000
Li Tom,Tom,2012-01-11,2000
Zhou John,John,2012-01-13,3000
lin sam,sam,2012-01-11,2000
Li Tom,Tom,2013-01-20,3000
Zhou John,John,2013-01-28,4000

替换：

把sam替换成Sam（不改变源文件）

sed 's/sam/Sam/' salary.txt #替换每行第一个sam
sed 's/sam/Sam/g' salary.txt #替换每行所有的sam

上面打印所有文本，若只打印发生替换的行，用-n和p命令

sed -n 's/sam/Sam/gp' salary.txt

若要改变源文件，加-i

sed -i 's/sam/Sam/g' salary.txt #把源文件的所有sam替换成Sam

只改变指定的行

sed '1,3 s/000/111/g' salary.txt #第一到第三行的000替换成111

每行从第2处匹配开始替换

sed 's/sam/Sam/2g' salary.txt

将第2~4行替换成 "new 2-4 lines"

sed '2,4c new 2-4 lines' salary.txt

删除：

sed '2,4d' salary.txt #删2~4行
sed '4,$d' salary.txt #删第4到最后一行
sed '/^$/d' salary.txt #删除空白行
sed '/^lin/d' salary.txt #删除以lin开头的行
sed '/sam/,/Tom/d' salary.txt #删除 包含sam行 到 包含Tom行 之间的所有行

添加

sed '2a new line' salary.txt #在第2行后面添加
sed '2i new line' salary.txt #在第2行前面插入

添加多行，在第2行前面插入两行new line 和 new line2

sed '2i new line\
> new line2' salary.txt

定界符

习惯了用/作为定界符，也可以用其他符号

sed 's:sam:Sam:g' salary.txt #以：作为定界符
sed 's~sam~Sam~g' salary.txt #以~作为定界符

匹配字符串

匹配到的字符串用 & 代替，&代表的所有匹配到的字符串，\<s匹配的单词开始

sed 's/\<s\w*/{&}/g' salary.txt #以s开头的单词用{&}代替

子字符串匹配

\(..\) 用于匹配子串，\n表示第n个匹配到子字符串，\1表示第一个匹配到的

sed 's/\(\w*\) \(\w*\)/\2 \1/' salary.txt #把第一个匹配到的\w*\ 跟第一个交换了一下位置

脚本

把上面的命令写入sedScript：

s/\(\w*\) \(\w*\)/\2 \1/

运行：

sed -f sedscript salary.txt

得到同样的效果