【shell】shell脚本实战-awk基本介绍

        • 前言
  • 概念

  • awk常用的选项和命令

  • awk的选项

  • awk的环境变量

  • awk的运算符

  • awk的内置字符串函数

前言

我们之前学习过grep,sed,这两个工具的作用如下:

grep和egrep:文本过滤的

sed:流编辑器,实现编辑的

今天我们要讨论的awk,是一个主要做文本输出的。

概念

AWK是一种优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一。这种编程及数据操作语言的最大功能取决于一个人所拥有的知识。awk命名:Alfred Aho Peter 、Weinberger和brian kernighan三个人的姓的缩写。

简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理

快速掌握awk的技巧:只要记住awk是以行为单位读入和输出的

awk常用的选项和命令

| 参数 | 含义 |

| — | — |

| -F | 指定字段一个或多个分割符 例如:-F’[:#/]’ 定义三个分隔符 |

| -v | 定义或修改一个awk内部的变量 |

| NR | 行号 |

| FS | 字段的分隔符,默认为空格,跟-F选择一样 |

| OFS | 输出的字段分隔符,默认为空格(即把空格替换成指定的字符串) |

| RS | 输入记录的分割,以分割符分割之后,使之成为新的行(即读入行的时候遇到指定分隔符,就把分割替换成\n)。 |

| ORS | 输出的记录分隔符,默认为新行。(即读入行的时候遇到\n之后把\n用指定的分隔符代替,然后读入一行,并合并为同一行) |

| $NF | 表示最后一列 |

| $0 | 显示当前一整行 |

| $N | N为数字(N>0),表示第几列。例如:$1表示用-F指定分隔符分隔后的第一列, 2… 2… 2…N以此类推 |

| {} | 命令代码块,包含一条或多条命令 |

| ; | 多条命令使用分号分隔 |

| ~ | 匹配字段,与==相比不是精确比较 |

| !~ | 不匹配,不精确比较 |

| == | 等于,必须全部相等,精确比较 |

| > | 大于 |

| < | 小于 |

| >= | 大于等于 |

| <= | 小于等于 |

| != | 不等于,精确比较 |

| && | 逻辑与 |

| || | 逻辑或 |

| + | 匹配1个或1个以上 |

| // | 正则匹配符 |

| print | 输出、打印 |

awk的选项

| 选项 | 描述 |

| — | — |

| -f progfile --file=progfile | 从脚本文件中读取awk命令 |

| -F fs --field-separator=fs | 指定字段一个或多个分割符 例如:-F’[:#/]’ 定义三个分隔符 |

| -v var=val --assign var=val | 定义或修改一个awk内部的变量 |

| -b --characters-as-bytes | 将所有输入数据视为单字节字符。posix选项或覆盖这个选项 |

| -c --traditional | 在兼容模式下运行。在兼容模式下,gawk的行为与UNIX awk相同;没有一个可以识别特定于gn的扩展 |

| -C --copyright | 在标准输出和退出中成功打印GNU版权信息消息的简短版本 |

| -d[file]–dump-variables[=file] | 将全局变量的排序列表、它们的类型和最终值打印到文件中。如果没有提供文件,gawk使用一个名为awkvars的文件 |

| -e ‘program-text’–source=‘program-text’ | 使用程序文本作为AWK程序源代码。这个选项允许轻松地将库函数(通过-f和-file选项使用)与在命令行中输入的源代码混合使用。它主要用于shell脚本中使用的中型到大型AWK程序 |

| -E file --exec=file | 与-f类似,这是最后一个处理的选项。这应该与#一起使用!脚本,特别是为CGI应用程序,以避免从URL向命令行传递选项或源代码(!)。这个选项禁止命令行变量赋值 |

| -g --gen-pot | 扫描和解析AWK程序,并在标准输出上生成GNU .pot(可移植对象模板)格式文件,其中包含程序中所有可本地化字符串的条目。程序本身没有执行。 |

| -h --help | 简短的打印帮助 |

| -L [fatal] --lint[=fatal] | 提供关于可疑或不可移植到其他AWK实现的构造的警告 |

| -n --non-decimal-data | 识别输入数据中的八进制和十六进制值 |

| -N --use-lc-numeric | 使用句点作为小数点 |

| -O --optimize | 在程序的内部表示上启用优化。目前,这包括简单的常数合并 |

| -p[file] --profile[=file] | 将分析数据发送到PROFIX文件。默认值是DouthPo.OUT |

| -P --posix | 启动兼容模式;将有如下限制: <1>无法识别\x <2>当FS被设置为单个空间时,只有空格和Tab充当字段分隔符,换行符不被设置为分隔符 <3>之后行不能有?和: <4>关键字函数的同义词FUNC不被识别 <5>运算符=不能代替和= |

| -r --re-interval | 允许在正则表达式匹配中使用区间表达式 |

| -R --command file | 只有DGAWK。从文件读取存储的调试器命令 |

| -S --sandbox | 在沙盒模式下运行GOWK,禁用Stand()函数,用GETLIN输入重定向,输出Read打印和打印的方向,并加载动态扩展。命令执行(通过管道)也被禁用。这有效地阻止了脚本访问本地资源(除了 命令行中指定的文件) |

| -t --lint-old | 提供对UNIX AWK原始版本不可移植的结构的警告 |

| -V --version | 打印AWK的版本信息 |

awk的环境变量

| 变量 | 描述 |

在这里插入图片描述

感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的:

① 2000多本Python电子书(主流和经典的书籍应该都有了)

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且经典的练手项目及源码)

④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里无偿获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 15
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值