面试官都在问 | Linux命令sed详解

面试官都在问 | Linux命令sed详解

在这里插入图片描述

1. sed详解

sed是一个精简的、非交互式的流式编辑器,它在命令行中输入编辑命令和指定文件名,然后在屏幕上查看输出。

sed的工作方式

逐行读取文件内容存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。原文件内容并没有改变。

语法格式
sed   [option]   "pattern command"   file
高频选项

选项可以用来控制sed的处理流程。

编号选项含义
1-n只打印模式匹配的行
2-e直接在命令行进行sed编辑,默认选项
3-f编辑动作保存在文件中,指定文件执行
4-r支持扩展正则表达式
5-i直接修改文件内容

本文中所有测试都用如下内容:

[root@localhost ~]# cat passwd 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:ROOT:/sbin:/sbin/nologin
adm:x:3:4:Root:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:

测试-n,只显示匹配的行:

[root@localhost ~]# sed -n '/root/p' passwd 
root:x:0:0:root:/root:/bin/bash

测试-e,多个匹配条件:

[root@localhost ~]# sed -n -e '/root/p' -e '/ROOT/p' passwd
root:x:0:0:root:/root:/bin/bash
daemon:x:2:2:ROOT:/sbin:/sbin/nologin

测试-f,执行指定文件:

[root@localhost ~]# cat my.sed 
/root/p
/Root/p
[root@localhost ~]# sed -n -f my.sed passwd
root:x:0:0:root:/root:/bin/bash
adm:x:3:4:Root:/var/adm:/sbin/nologin

测试-r,支持扩展正则:

[root@localhost ~]# sed -n -r '/root|ROOT/p' passwd # |是扩展正则
root:x:0:0:root:/root:/bin/bash
daemon:x:2:2:ROOT:/sbin:/sbin/nologin

前面的修改都是显示到屏幕,不会修改源文件,我们现在用-i,修改源文件:

[root@localhost ~]# sed -i 's/bin/BBB/g' passwd
[root@localhost ~]# cat passwd
root:x:0:0:root:/root:/BBB/bash
BBB:x:1:1:BBB:/BBB:/sBBB/nologin
daemon:x:2:2:ROOT:/sBBB:/sBBB/nologin
adm:x:3:4:Root:/var/adm:/sBBB/nologin
lp:x:4:7:lp:/var/spool/lpd:

2. pattern 详解

sed是逐行处理文本,拿到一行内容,先进行匹配,如果满足,才执行命令,如果匹配不上,是不会对该行进行处理。

编号匹配模式含义
14command匹配到第4行
23,5command从第3行开始,到5行结束
33,+2command从第3行开始,到第6行结束
4/pattern/command匹配到pattern的行
5/pattern1/,/pattern2/command从匹配到pattern1开始,到匹配到pattern2结束
62,/pattern/command从第二行开始,到匹配pattern结束
7/pattern/,5command匹配到pattern开始,到第5行结束

这里面第4种和第5种是我们实际工作中用的最多的,当然,一般这里都是很复杂的正则,这里我就以这两种来演示。

打印所有不能登录的用户:

[root@localhost ~]# sed -n '/\/sbin\/nologin/p' passwd
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:ROOT:/sbin:/sbin/nologin
adm:x:3:4:Root:/var/adm:/sbin/nologin

寻找以bin开始到以adm结束的行:

[root@localhost ~]# sed -n '/^bin/,/^adm/p' passwd
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:ROOT:/sbin:/sbin/nologin
adm:x:3:4:Root:/var/adm:/sbin/nologin

3. 编辑命令详解

类别编辑命令含义
查询p打印
增加a行后追加
i行前追加
r读入外部文件
w匹配行写到外部文件
删除d删除
修改s/old/new/将行内第一个old换成new
s/old/new/g将行内第所有old换成new
s/old/new/ig将行内第所有old换成new,忽略大小写

下面我们来演示上面的编辑命令。

删除所有不能登录的用户:

[root@localhost ~]# sed -i '/\/sbin\/nologin/d' passwd
[root@localhost ~]# cat passwd
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:

我们经常有一种需求,删除配置文件中的注释行和空行,注释行一般都是以#开头,命令如下:

sed -e '/[:blank:]*#/d' -e'/^$/d' /etc/my.cnf 

在root用户后增加一行AAAAAAAAA:

[root@localhost ~]# sed '/^root/a AAAAAAAAA' passwd
root:x:0:0:root:/root:/bin/bash
AAAAAAAAA
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:ROOT:/sbin:/sbin/nologin
adm:x:3:4:Root:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:

将所有的root不区分大小写,全部替换成“管理员”:

[root@localhost ~]# sed 's/root/管理员/ig' passwd
管理员:x:0:0:管理员:/管理员:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:管理员:/sbin:/sbin/nologin
adm:x:3:4:管理员:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:

&用在替换字符串时,代表被替换的字符串。

我们想把所有的root,不论大小写,都改成原本的root后面追加上ing:

[root@localhost ~]# sed 's/root/&ing/ig' passwd
rooting:x:0:0:rooting:/rooting:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:ROOTing:/sbin:/sbin/nologin
adm:x:3:4:Rooting:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:

另外需要注意的是,如果匹配模式中使用了变量,建议用双引号。

OLD=root
NEW=123
sed  "s/$OLD/$NEW/g" passwd

4. 综合实践

实际项目基本都有配置文件,我们现在利用sed统计配置文件各个段有多少条记录。

测试文件内容如下:

[Log]
#日志文件输出目录和文件名
LogName=error.log
#只打印日志等级<=LogLevel的日志到日志文件中
LogLevel=8

#进程相关
[Proc]
#worker进程个数
WorkerProcesses=4
#是否按守护进程方式运行
Daemon=1
#处理接收到的消息的线程池中线程数量,不建议超过300
ProcMsgRecvWorkThreadCount=2

[Net]
#监听的端口数量
ListenPortCount=2
ListenPort0=80
ListenPort1=443

#每个worker进程允许的最大连接数
worker_connections=1024

#延迟回收的等待时间
Sock_RecyConnectionWaitTime=80

我们的思路是:

  1. 找出[]的行,查找出段。
  2. 根据给出的段名,找出该段的所有信息,然后过滤掉注释和空行
CONF_FILE_NAME=ngx.conf

get_segments() { # 这个函数的功能是找出以[开头,]结尾的行,通过echo返回出去。
	
	# 取出[]的行,然后将删除[]
	echo `sed -n '/\[.*\]/p' $CONF_FILE_NAME | sed -e 's/\[//' -e 's/\]//'`
}

get_count_in_segment() { # 这个函数根据段名统计当前段的配置项的数量
	#  $1 是传递过来的段名
	#  把从给定的段到下一个段之间的数据过滤出来。
	#  将过滤出来的数据清除掉空行和注释行
	items=`sed -n "/\[$1\]/,/\[.*\]/p" $CONF_FILE_NAME  | sed -e '/^#/d' -e '/^$/d' -e '/\[.*\]/d'`
	
	# 统计数量
	i=0
	for item in $items
	do
		i=`expr $i + 1`
	done
	echo $i
}

num=0
for seg in `get_segments` # get_segments得到所有的段
do
	num=`expr $num + 1` #有多少个段
	cnt=`get_count_in_segment $seg` #统计当前段的配置项数量
	echo "$num $seg : $cnt"
done

执行结果:

[root@localhost ~]# ./my.sh 
1 Log : 2
2 Proc : 3
3 Net : 5

5. 总结

sed主要用于文本行的处理。这里需要重点强调一下,***sed中选项和命令不一样哦,大家可以回过去对比一下***

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值