awk的基本使用

∮d(y)√i²

已于 2023-08-05 19:13:07 修改

阅读量98

点赞数

文章标签：笔记

于 2023-08-05 17:47:06 首次发布

本文链接：https://blog.csdn.net/qq_60680687/article/details/132119441

版权

4.1、只显示/etc/passwd的账户

4.2、搜索/etc/passwd有关键字root的所有行

4.3、输出/etc/passwd文件中以nologin结尾的行

4. 4、在 a b f g h 的b后面插入三个字段c d e

4.5、打印奇数行

1、awk的变量使用

变量：内置和自定义变量，每个变量前加 -v 命令选项

FS	输入字段分隔符，默认为空白字符
OFS	输出字段分隔符，默认为空白字符
RS	输入记录分隔符，指定输入时的换行符，原换行符仍有效
ORS	输出记录分隔符，输出时用指定符号代替换行符
NF	字段数量，共有多少字段， $NF引用最后一列，$(NF-1)引用倒数第2列
NR	行号，后可跟多个文件，第二个文件行号继续从第一个文件最后行号开始
FNR	各文件分别计数, 行号，后跟一个文件和NR一样，跟多个文件，第二个文件行号从1开始
FILENAME	当前文件名
ARGC	命令行参数的个数
ARGV	数组，保存的是命令行所给定的各参数，查看参数

1)FS的使用

2）ARGC的使用

2、筛选给定范围内的日志写出来

1）首先我们需要用到的是awk提供的函数mktime()；

mktime() 函数功能：将时间转换为自1970年1月1日以来逝去时间的秒数,发生错误时返回-1。也就是是把获取的时间转换成时间戳。

例子：

本实例是 2019-11-10 3-42-41 距离1970年的1月1日，相差了1573375361秒

2）将2019-11-10T03:42:40+08:00格式的字符串转换成epoch值：我们用到的patsplit，它是将我们匹配成功的放入一个数组中

BEGIN{
  str="2019-11-10T03:42:40+08:00"
  patsplit(str,arr,"[0-9]{1,4}")
  Y=arr[1]
  M=arr[2]
  D=arr[3]
  H=arr[4]
  m=arr[5]
  S=arr[6]
 print mktime(sprintf("%s %s %s %s %s %s",Y,M,D,H,m,S ))
}

最后我们打印输出的用到了mktime()函数，即得出的是距离上一个时间的秒数

3）输出2019-11-10 3-42-40以后的日志

BEGIN{
  which_time = mktime("2019 11 10 03 42 40")
}
{
  match($0,"^.*\\[(.*)\\].*",arr) //取出日志中的时期时间字符串部分
   tmp_time = strptime1(arr[1])  //将日期时间转换
  if(tmp_time > which_time){print} //打印which_time之后的
}

function strptime1(str ,arr,Y,M,D,H,m,S){
patsplit(str,arr,"[0-9]{1,4}")
  Y=arr[1]
  M=arr[2]
  D=arr[3]
  H=arr[4]
  m=arr[5]
  S=arr[6]
 return mktime(sprintf("%s %s %s %s %s %s",Y,M,D,H,m,S ))
}

4）当我们的时间里有英文的缩写处理方式

例如：构建的时间字符串格式为："10/Nov/2019:23:53:44+08:00"

gensu() ：是一个通用的替代函数

function strptime2(str,dt_str,arr,Y,M,D,H,m,S) {
  dt_str = gensub("[/:+]"," ","g",str)
  # 经过gensub函数的处理得到：dt_sr = "10 Nov 2019 23 53 44 08 00" 
  split(dt_str,arr," ")
  Y=arr[3]
  M=mon_map(arr[2]) #第二个字段是月份，故我们需要对它进行转换
  D=arr[1]
  H=arr[4]
  m=arr[5]
  S=arr[6]
  return mktime(sprintf("%s %s %s %s %s %s",Y,M,D,H,m,S))
}

function mon_map(str,mons){
  mons["Jan"]=1
  mons["Feb"]=2
  mons["Mar"]=3
  mons["Apr"]=4
  mons["May"]=5
  mons["Jun"]=6
  mons["Jul"]=7
  mons["Aug"]=8
  mons["Sep"]=9
  mons["Oct"]=10
  mons["Nov"]=11
  mons["Dec"]=12
  return mons[str]
}

3、统计TCP连接状态数量

先查看自己本机：

统计状态数量：

netstat -antp | awk '{arr[$6]++}END{for (i in arr){print arr[i], i}}'
# $6的意思就是统计的第六列

得出的结果有 enstablished 和Foreign 是不和题意的，故我们需要修改表达式：

netstat -antp | awk '/^tcp/{arr[$6]++}END{for (i in arr){print arr[i], i}}'
# 我们加了一个tcp ，即仅仅统计tcp中的，就不会统计上面的