一:awk的工作原理
- 逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
- sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个字段"然后再进行处理.awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。
- 在使用awk命令的过程中,可以使用逻辑操作符"&&“表示"与”、“I1"表示"或”、"!“表示w非”;还可以进行简单的数学运算
- 如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。
二:awk的命令格式
-
awk选项’模式或条件{操作}'文件1文件2…
-
awk -f脚本文件文件1文件2 …
-
awk常见的内建变量(可直接用)如下所示:
NF:当前处理的行的字段个数。NR:当前处理的行的行号(序数)。
$o:当前处理的行的整行内容。
-
$n:当前处理行的第n个字段(第n列)。
-
FILENAME:被处理的文件名。
FS:列分割符:指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
RS:行分隔符:awk从文件上读取资料时,将根据Rs的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理,预设值是‘\n’
三:awk操作实例演示
- 按行输出文本:
awk ‘{print}’ testfile2 输出所有内容
awk ‘ {print $0}’ testfile2 输出所有内容
awk ‘NR==1,NR==3{print} ' testfile2 #输出第1~3行内容
awk '(NR>=1)&&(NR<=3){print}' testfle2 输出第1~3行丙容
awk 'NR==1||NR==3{print} ' testfile2 #输出第1行、第3行内容
awk '(MR%2)==1{print}’ testfile2 #输出所有奇数行的内容
awk ‘(NR%2)==0{print}’ testfile2 输出所有偶数行的丙容
awk '/^root/{print}' /etc/passwd #输出以root开头的行
awk '/nologin$/{print}' /etc/passwd 输出以 nologin结尾的行
awk 'BEGIN {x=0};/\bin\/bash$/ {x++};END {print x}' /etc/passwd#统计以/bin/bash结尾的行数,相当于grep -c " /bin/bash$" /etc7passwd
- 按字段输出文本:
awk-F “:” ‘[ print $3} ‘ /etc/passwd #输出每行中(以空格或制表位分隔)的第3个字段
awk-F " :” "[print $1,$3}" fetc/ passwd #输出每行中的第1、3个字段
awk -F ":” ‘$3<5 {print $1,$3}' /etc/passwd 输出第3个字段的值小于5的第1、3个字段内容
awk -F ":" "!($3<200) {print}' etc/passwd #输出每行第3个字符的值不小于200的行
awk 'BEGIN (FS=":"); (if($3>=200) {print}’) /etc/passwd #先处理完BEGIN的内容,再打印文本里面的内容
awk -F":" '{max=($3>$4)?$3:$4; {print max}}' /etc/passwd #三元运算符,如果第3个字段的值大于第4个字段的值,则把第3个字段的值赋给max,否则第4个字段的值赋给max
awk -F":" '{print NR,$0}' /etc/passwd #输出每行内容和行号,每处理完一条记录,NR值加1
awk -F ":" '$7~ "/bash" ‘{print $1}' /etc/passwd #输出以冒号分隔且第7个字段中包含/bash的行的第1个字段