文本处理awk

最新推荐文章于 2024-11-12 23:07:13 发布

熙哥1987

最新推荐文章于 2024-11-12 23:07:13 发布

阅读量486

点赞数

分类专栏： linux 文章标签： linux awk 数据分析脚本

本文链接：https://blog.csdn.net/zjx839524906/article/details/37564111

版权

linux 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

awk

简介

awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。实际上awk确实有自己的程序设计语言——样式扫描和处理语言。

使用方法

awk '{pattern + action}' {filenames}

调用awk

</pre><pre name="code" class="css"><span style="font-size:14px;">1.命令行方式
awk [-F  field-separator]  'commands'  filename
其中，commands 是真正awk命令，[-F域分隔符]是可选的。 input-file(s) 是待处理的文件。
在awk中，文件的每一行中，由域分隔符分开的每一项称为一个域。

2.shell脚本方式
将所有的awk命令插入一个文件，并使awk程序可执行，然后awk命令解释器作为脚本的首行，一遍通过键入脚本名称来调用。</span>

awk内置变量

ARGC               命令行参数个数
ARGV               命令行参数排列
ENVIRON            支持队列中系统环境变量的使用
FILENAME           awk浏览的文件名
FNR                浏览文件的记录数
FS                 设置输入域分隔符，等价于命令行 -F选项
NF                 浏览记录的域的个数
NR                 已读的记录数
OFS                输出域分隔符
ORS                输出记录分隔符
RS                 控制记录分隔符

awk常用函数

gsub(r,s)<span style="white-space:pre">	</span>在整个$0中用s代替r
gsub(r,s,t)<span style="white-space:pre">	</span>在整个t中用s替代r
index(s,t)<span style="white-space:pre">	</span>返回s中字符串t的第一位置
length(s)<span style="white-space:pre">	</span>返回s长度
match(s,r)<span style="white-space:pre">	</span>测试s是否包含匹配r的字符串
split(s,a,fs)<span style="white-space:pre">	</span>在fs上将s分成序列a
sprint(fmt,exp)<span style="white-space:pre">	</span>返回经fmt格式化后的exp
sub(r,s)<span style="white-space:pre">	</span>用$0中最左边最长的子串代替s
substr(s,p)<span style="white-space:pre">	</span>返回字符串s中从p开始的后缀部分
substr(s,p,n)<span style="white-space:pre">	</span>返回字符串s中从p开始长度为n的后缀部分