之前大三上的时候有一门linux操作系统课讲过linux基本操作,shell,awk,sed,还有怎么写字符驱动程序之类的
最近要找工作,复习一下
一、基本用法
#格式
awk 动作 文件名
#示例
awk '{print $0}' awk.txt
print是打印命令,$0代表当前行,所以示例语句的意思是原样打印当前行
awk会根据空格和制表符,将每一行分成若干字段,依次用$1、 $2、$3代表第一个字段,第二个字段和第三个字段。
也可以用 -F 指定符号用于分隔
比如下面这段文字
root:x:0:0:root:/root:/usr/bin/zsh
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync
$ awk -F ':' '{print $1}' awk.txt
root
daemon
bin
sys
sync
二、变量
NF表示当前行有多少个字段
$ echo 'this is a test' | awk '{print $NF}'
test
$(NF-1)代表倒数第二个字段
$ awk -F ':' '{print $1, $(NF-1)}' demo.txt
root /root
daemon /usr/sbin
bin /bin
sys /dev
sync /bin
print输出的时候可以用逗号隔开
NR表示当前处理的是第几行
$ awk -F ':' '{print NR ") " $1}' demo.txt
1) root
2) daemon
3) bin
4) sys
5) sync
awk的其他内置变量有
FILENAME:当前文件名
FS:字段分隔符,默认是空格和制表符。
RS:行分隔符,用于分割每一行,默认是换行符。
OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。
ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。
OFMT:数字输出的格式,默认为%.6g。
三、函数
awk有一些内置函数
tolower():字符转为小写。
length():返回字符串长度。
substr():返回子字符串。
sin():正弦。
cos():余弦。
sqrt():平方根。
rand():随机数。
四、条件
$ awk '条件 动作' 文件名
awk支持正则表达式,条件可以为正则表达式
$ awk -F ':' '/usr/ {print $1}' demo.txt
root
daemon
bin
sys
也可以为其他条件语句
例如
# 输出奇数行
$ awk -F ':' 'NR % 2 == 1 {print $1}' demo.txt
root
bin
sync
# 输出第三行以后的行
$ awk -F ':' 'NR >3 {print $1}' demo.txt
sys
sync
#输出第一个字段等于指定值的行
$ awk -F ':' '$1 == "root" {print $1}' demo.txt
root
$ awk -F ':' '$1 == "root" || $1 == "bin" {print $1}' demo.txt
root
bin
五、if语句
awk支持if else条件控制语句,可以用来编写复杂的条件。
$ awk -F ':' '{if ($1 > "m") print $1}' demo.txt
root
sys
sync
$ awk -F ':' '{if ($1 > "m") print $1; else print "---"}' demo.txt
root
---
---
sys
sync