sed 字符流编辑器
sed 是Stream Editor(字符流编辑器)的缩写,简称刘编辑器。
sed 是操作、过滤和转换文本内容的强大的工具。常用功能包括对文件实现快速增删改查,其中查询的功能中最常用的两大功能是过滤(过滤制定字符串)取行(取出指定行)
语法格式:sed【选项】【sed内置命令字符】【输入文件】
注意:
1.sed 以及后面的选项、命令和输出文件,每个元素之间都要至少要有一个空格
2.在sed中引入shell变量,如:ip=hostname -I;echo "hello world">>one|sed "s#hello#$ip#" one
参数选项:
参数
说明
-i
直接修改文件内容
-n
静默模式,仅打印和sed命令匹配的内容
-r
支持扩展表达式(预设是基础正规表示法语法)
-e
直接在命令行模式上进行sed动作编辑,此为默认选项。也表示多点编辑
-f
将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作
-V
-V或--version 显示版本信息
动作参数说明:
参数
简述
详情
a\
新增
在当前行下面插入文本
c\
取代
把选定的行改为新的文本
i\
插入
在当前行上面插入文本
b
跳过
跳过匹配的条件
d
删除
删除选择的行
p
打印
打印模板块的行,通常 p 会与参数 sed -n 一起运行
s
取代
替换指定字符,例如 1,20 s/old/new/g
g
替换
表示行内全面替换
y
更新
表示把一个字符翻译为另外的字符(但是不用于正则表达式)
r
文件
从目标文件中读取
y
翻译
把一个字符翻译为另外的字符,前后翻译字符数要保持一致
lable
标记
自定义标记内容的执行与否
sed 元字符集
字符集
说明
案例
\^
锚定行的开始
如:'^grep' 匹配所有以 grep 开头的行
$
锚定行的结束
如:'grep$' 匹配所有以 grep 结尾的行
.
匹配一个非换行符的字符
如:'gr.p' 匹配 gr 后接一个任意字符,然后是 p
*
匹配零个或多个先前字符
如:' *grep' 匹配所有一个或多个空格后紧跟 grep 的行。 .* 一起用代表任意字符
[ ]
匹配一个指定范围内的字符
如:'[Gg]rep' 匹配 Grep 和 grep
[^ ]
匹配一个不在指定范围内的字符
如:'[^A-FH-Z]rep' 匹配不包含 A-F 和 H-Z 的一个字母开头,紧跟 rep 的行
\(..\)
标记匹配字符
如:'(love)',love 被标记为1
&
保存搜索字符用来替换其他字符
如s/love/**&**/,love这成**love**
\<
锚定单词的开始
如:'\
\>
锚定单词的结束
如:'grep\>' 匹配包含以grep结尾的单词的行
x{m}
连续重复字符 x,m 次
如:'o{5}' 匹配包含连续5个o的行
x{m,}
连续重复字符 x,至少 m 次
如:'o{5,}' 匹配至少连续有5个 o 的行
x{m,n}
连续重复字符 x,至少 m 次,不多于 n 次
如:'o{5,10}' 匹配连续 5-10 个 o 的行
[:digit:]
所有数字, 相当于0-9
如:[0-9]---> [[:digit:]]
[:lower:]
所有的小写字母
如:[a-z]---> [[:lower:]]
[:upper:]
所有的大写字母
如:[A-Z]---> [[:upper:]]
[:alpha:]
所有的字母
如:[A-Za-z]---> [[:alpha:]]
[:alnum:]
非特殊符号,相当于0-9a-zA-Z
如:[0-9a-zA-Z]---> [[:alnum:]]
[:space:]
空白字符
如:[ ]---> [[:space:]]
[:punct:]
所有标点符号
如:[^0-9a-zA-Z]---> [[:punct:]]
注意:扩展正则表达式必须结合 -r 选项
常用:命令 sed 替换用法举例
源文件
示例:
序号
指令
说明
①
sed -i '/news/c HAPPY' bak.txt
匹配 news 字符的行,替换成 HAPPY 的行
②
sed -i 's#static#stop#' bak.txt
把 static 字符替换成 stop 字符
③
sed -i '/server/s#68\.1#76\.3#' bak.txt
匹配 server 的字符行,把 68.1 替换成 76.3 由于点号有特殊意义所有需要转义
④
sed -i 's#lp#LP#2g' bak.txt
把所有匹配到 的行中第二次及以后出现的 lp 字符替换成 LP 字符
⑤
sed -i 's#root#tom#2p' bak.txt
把所有匹配到字符 bin 的行中第二次出现的 root 替换成 tom 字符,并再生产与匹配行同样的行
⑥
sed -i 's#games#GAMES#2' bak.txt
把所有匹配到字符 usr 的行,第三次出现的 usr 替换成 USR 字符
⑦
sed -i '/sys/{s#/dev#/log#;s#3#6#g}' bak.txt
匹配字符 sys 的行,把字符 dev 替换成 log 字符,且把 3 替换成 6
⑧
sed -i 's#nologin#(&)#g' bak.txt
把 nologin 用括号括起来,& 表示引用前面匹配的字符
⑨
sed -i 's/sys:x/#&/g' bak.txt
匹配字符 sys:x 的行前面添加 # 号
⑩
sed -i '/tcp/s#;# #g' bak.txt
匹配字符 tcp 的行,把分号替换成空,也可用于去注释 # 号
改变后的
常用:命令 sed 简单变量举例
引用变量
注意:当sed命令也有默认变量时,在去引用自己定义的变量会出现语法错误
注意:当sed命令里面没有默认的变量时可以把单引号改成双引号当sed命令里面有默认的变量时,那自己定义的变量需要加单引号,且sed里面的语句必须用单引
进阶:命令 sed 的高级使用
案例一
正在操作的内容行写入到文件中
指定行号添加内容
案例二
获取域名信息
源文件与结果样式
cat yuming.txt|sed 's#http:\/\/##;s#\/.*##'|sort|uniq -c|sort -rn
awk -F/ '{print $3}' yuming.txt|sort -r|uniq -c|awk '{print $1"\t",$2}'
命令参数用法举例
案例一
参数 -n 举例
注意:在不加 -n 时,检索到的行重复打印两遍,原因是 sed 默认会打印文件中的所有行
注意:当使用多个 sed 编辑命令时,需用 {} 并用分号进行分隔
案例二
动作参数 s 举例
在匹配的行尾添加 book 字符
在 is 字符前添加 ysg
动作参数 i 举例
动作参数 a 举例
动作参数 d 举例
删除 3 至最后一行
动作参数 b 举例,跳过某些符合的条件
动作参数 c 举例
整行取代 2-4 行的数据
动作参数 lable 、y 举例
注意:在不适用 -i 参数时,原文本不会被修改,当使用 -i 参数时表示写入并修改文本,参数 -e 表示直接在命令行模式上进行sed动作编辑,此为默认选项
案例三
sed 的正则表达式举例
举例
说明
sed '5 q' /etc/passwd
打印前 5 行
sed -n '1,3p' /etc/passwd
打印 1-3 行
I sed -n '5,/^man/p' /etc/passwd I 打印从第5行开始到第一个包含以 man 开始的行之间的所有行(如果 man 不存在则打印到结尾) I
| sed -n '/r*t/p' /etc/passwd | 打印匹配r有 0 个或者多个,后接一个 t 字符的行 |
| sed -n '/.r.*/p' /etc/passwd | 打印匹配有r的行并且r后面跟任意字符 |
| sed -n '/o*/p' /etc/passwd | 打印o字符重复任意次 |
| sed -n '/o\{1,\}/p ' /etc/passwd | 打印o字重复出现一次以上 |
| sed -n '/o\{1,3\}/p ' /etc/passwd | 打印o字重复出现一次到三次之间以上 |
| sed -n '/^#/!p' /etc/vsftpd/vsftpd.conf | 打印以 # 开头的行,进行取反,已达到过滤注释的效果 |
| sed -n '/^#/!{/^$/!p}' /etc/vsftpd/vsftpd.conf | 匹配以 # 开头的行,进行取反,然后在其结果中对空格开头的行进行取反,表示过滤空格与注释 |
| sed -e '/^#/d' -e '/^$/d' /etc/vsftpd/vsftpd.conf | 删除匹配的空格行与 # 号开头的行,sed支持对单个文件进行多条件操作 |
案例一
案例二
参数 \w\+ 匹配每一个字符 ,使用 [&] 替换它,& 对应于之前所匹配到的单词
案例三
子串匹配标记 \1 举例
注意:\1 代表被匹配到的第一个模式,\2 代表第二个模式,以此类推。sed中可以并只记录 9 个模式。
案例四
选定行的范围:,(逗号)举例
案例五
打印奇数行或偶数行
打印匹配字符串的下一行
注意:sed '表达式' | sed '表达式',等价于,sed '表达式; 表达式'
扩展使用
案例一
保持和获取:h 命令和 G 命令
在 sed 处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将 打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理
匹配 test 的行被找到后,将存入模式空间,h 命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。第二条语句的意思是,当到达最后一行后,G 命令取出保持缓冲区的行,然后把它放回模式空间中,且追加到现在已经存在于模式空间中的行的末尾。在这个例子中就是追加到最后一行
简单来说,包含 test 的最后一行会被复制并追加到该文件的尾部
注意:H 命令为把包含 test 的所有行复制并追加到该文件的尾部
注意:我看了网上关于 h 命令和 x 命令的介绍:互换模式空间和保持缓冲区的内容。也就是把包含test与check的行互换,但亲测结果并不是这样的,也看了 man ,这就不多说什么了,也许是方法有误吧,有兴趣研究的,有了结果后,也希望评论交流下