awk学习笔记

最新推荐文章于 2024-07-11 19:55:00 发布

acsunqi

最新推荐文章于 2024-07-11 19:55:00 发布

阅读量231

点赞数

分类专栏： Linux 文章标签： awk linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/acsunqi/article/details/103923654

版权

Linux 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

awk学习笔记

awk的用途

awk 在复杂的文本数据中，能够帮助用户筛选出需要的信息。

awk常见用法

awk 'pattern' file
awk '{action} file'
awk 'pattern {action} file'

pattern即模式的意思，awk能够与强大的正则表达式结合，从复杂多变的数据中筛选出需要的信息。

{action}内部的是awk脚本命令

常用的正则表达式符号

元字符	说明
^	在串首匹配
$	在串尾部匹配
.	匹配单个任意字符
*	匹配0个或者多个前导字符
+	匹配1个或者多个前导字符
?	匹配0个或者一个前导字符
[ABC]	匹配A、B、C其中一个字符
[^ABC]	不匹配A、B、C其中一个字符
[A-Z]	匹配A-Z之间任意字符
A\|B	匹配A或者B
(A\|B)	匹配A或者B

典型的用例

简单的awk分割筛选数据的例子太多，这里我就不举例了。本文举一个配合正则表达式。从每一行中获取特定的内容，筛选出数据。

涉及的概念

常用的正则表达式符号
正则匹配捕获分组
管道 |
sort uniq等命令

任务背景

线上日志中会有一些异常的id输出，作为日志。我们需要把这些id从日志每一行中提取出来，反馈给数据侧。
需要提取的日志的格式大致如此

任意内容xxx userid:[03dc9c2d53fc6cxxxxx22b021c6200102142xxxxxx],fields:[*] xxxxxx

我们只需要提取出其中的id即可

解决方案

使用如下命令

awk '{match($0,/userid:\[([[:alnum:]]+)\],/,a);print a[1]}' logfile |sort|uniq >3.log

参考文献

awk中正则表达式的使用

awk之match函数

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
awk学习笔记

awk学习笔记awk的用途awk 在复杂的文本数据中，能够帮助用户筛选出需要的信息。awk常见用法awk 'pattern' fileawk '{action} file'awk 'pattern {action} file'pattern即模式的意思，awk能够与强大的正则表达式结合，从复杂多变的数据中筛选出需要的信息。{action}内部的是awk脚本命令常用的正则表达式...
复制链接

扫一扫

专栏目录

博客等级

码龄9年

40
原创

26
点赞

95
收藏

15
粉丝

关注

私信

热门文章

分类专栏

Linux 1篇
python 32篇
IAR 1篇
机器学习 4篇
操作系统 1篇
gui 1篇
算法刷题 1篇

最新评论

pyqt 状态机简单例子
aiyudehua: 如果一个状态可能转化成其他多种状态，我们有办法指定它转化为其中的某种吗？
Clion配置stm32嵌入式开发环境
Ashuaj: 博主你好,cubemx配置G系列芯片时候 Toolchain/ide选择不了sw4stm32,而其他系列没这个问题,你知道是什么情况吗?
clang 找不到标准库头文件错误
一只菜狗: clang++找不到头文件呢
clang 找不到标准库头文件错误
专业路人甲: 虽然是某种意义上通用的，但是这个是gcc的头文件
clang 找不到标准库头文件错误
qq_41097373: 有效，要把7改成你的C++头文件版本

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。