sed命令和awk命令
sed编辑器
- sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规矩来编辑数据流。
- sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中。
sed 的工作流程主要包括读取、执行和显示三个过程:
- 读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。
- 执行:默认情况下,所有的sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则sed 命令 将会在所有的行上依次执行。
- 显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。
注意:默认情况下所有的sed命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。
命令格式:
sed -e ‘操作’ 文件1 文件2…
sed -n -e ‘操作’ 文件1 文件2…
sed -f 脚本文件 文件1 文件2…
sed -i -e ‘操作’ 文件1 文件2…
常用选项及常用操作:
选项 | 作用 |
---|---|
-e | 表示用指定命令来处理输入的文本文件,只有一个操作命令时可省略,一般在执行多个操作命令使用。 |
-f | 表示用指定的脚本文件来处理输入的文本文件。 |
-h | 显示帮助。 |
-n --quiet 或 silent | 禁止sed编辑器输出,但可以与p命令一起使用完成输出。 |
-i | 直接修改目标文本文件。 |
常用操作:
选项 | 作用 |
---|---|
s | 替换,替换指定字符。 |
d | 删除,删除选定的行。 |
a | 增加,在当前行下面增加一行指定内容。 |
i | 插入,在选定行上面插入一行指定内容。 |
c | 替换,将选定行替换为指定内容。 |
y | 字符转换,转换前后的字符长度必须相同。 |
p | 打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以 ASCII 码输出。其通常与“-n”选项一起使用。 |
= | 打印行号。 |
l(小写L) | 打印数据流中的文本和不可打印的ASCII字符(比如结束符$、制表符\t) |
sed的命令操作
打印内容:
sed编辑器有两种2种寻址方式:
1.以数字形式表示行区间
2.用文本模式来过滤出行
删除行:
删除空行
“!”表示取反操作 所以能查找以nologin结尾的信息
替换:
行范围 s/旧字符串/新字符串/替换标记
4种替换标记
数字:表示新字符串将替换第几处匹配的地方
g:表明新字符串将会替换所有匹配的地方
p:打印与替换命令匹配的行,与-n一起使用
w 文件:将替换的结果写到文件中
以/做分隔符;以!做分隔符
替换字符串
插入:
awk命令
awk的工作原理:
逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
sed命令常用于:
整行的处理,而awk比较倾向于将一行分成多个“字段”然后再进行处理。awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”表示“与”、“||”表示“或”、“!”表示“非”;还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。
命令格式:
awk 选项 ‘模式或条件 {操作}’ 文件1 文件2
awk -f 脚本文件 文件1 文件2
awk常见的内建变量:
内建变量 | 作用 |
---|---|
FS | 列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同 |
NF | 当前处理的行的字段个数 |
NR | 当前处理的行的行号(序数) |
$0 | 当前处理的行的整行内容 |
$n | 当前处理行的第n个字段(第n列) |
RS | 行分隔符wk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是’\n’ |
FILENAME | 被处理的文件名 |
awk实例:
1.按行输出文本:
awk ‘{print}’ 文件
输出一到三行内容:
输出文本内奇数行和偶数行:
awk和正则表达式的运用
2.按字段输出文本:
awk -F “:” ‘{print $第几个字段}’ 文件
($3>$4)?$3:$4 三元运算符
3.通过管道、双引号调用 Shell 命令:
查看当前内存使用百分比:
查看当前CPU空闲率
显示系统启动的时间
date 查看系统时间
当月第一天
统计在线用户数
打印奇数;偶数行
- 当getline左右无重定向符“<”或“|”时,awk首先读取到了第一行,就是1,然后getline,就得到了1下面的第二行,就是2,因为getline之后,awk会改变对应的NF,NR,FNR和$0等内部变量,所以此时的$0的值就不再是1,而是2了,然后将它打印出来。
- 当getline左右有重定向符“<”或“|”时,getline则作用于定向输入文件;由于该文件是刚打开,并没有被awk读入一行,只是getline读入,那么getline返回的是该文件的第一行,而不是隔行。
将四个值相隔
awk输出数组内的值
输出文件中重复的值和值的次数