文本处理工具之awk

最新推荐文章于 2022-08-14 20:17:10 发布

KentZhang_

最新推荐文章于 2022-08-14 20:17:10 发布

阅读量414

点赞数

分类专栏： Shell命令

本文链接：https://blog.csdn.net/KentZhang_/article/details/84404887

版权

Shell命令专栏收录该内容

9 篇文章 0 订阅

订阅专栏

awk是一个文本处理工具，也是一中脚本语言。我常使用的就是下面的两个功能。

基本格式：

awk -F [str] ‘BEGIN{comand1}{commad2}END{command3}’ filename

-F 后面的跟的是分割符号，可以是一个字符，也可以是字符串.
中间的命令必须用单引号括起来
BEGIN表示开始循环开始前执行的命令，执行一次
END表示循环结束后执行的命令，执行一次
commnad2表示每处理一行，就执行一次
BEGIN和END可以省略

参加下面的实例：

过滤

<RedisCommandWithOutReplyValue> Failed to execute command:LPUSH, key:PROC|FAST|109, value:call AddLottery(13940887,149,464,129868120,9,'269,1037,781,525,1035',129868120,0);
## 以上是一行错误日志，test.txt中有大量的这样格式的日志，但是我仅需要过滤出AddLottery后的第1个和第4个数字。命令如下：
awk '{print $8}' test.txt |awk -F ',' '{printf  "%s,%s\n",$1, $4}'|awk -F '(' '{print $2}'
输出：
13940887,129868120

统计

接着上面的日志，假设还有一个需求：

对上面输出的结果，第一个数字要累加求和：

sum.txt 内容如下：
13940887,129868120
13940882,129868122
13940880,129868121
命令：
awk -F ',' 'BEGIN{sum=0;}{sum+=$1;}END{print sum}' sum.txt
输出：
41822649

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

KentZhang_

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

linux文本切割awk,文本处理工具之awk

weixin_42297439的博客

05-13

1153

文本处理工具之AWK一、linux文本处理工具三剑客：grep、sed、awk。其中grep是一种文本过滤器，sed是文本行编辑器，而awk是一种报表生成器，就是对文件进行格式化处理的，这里的格式化不是文件系统的格式化，而是对文件内容进行各种“排版”，进而格式化显示。在linux上我们使用的是GNU awk 简称 gawk，并且gawk是awk的链接文件，因此在系统上使用gawk和awk效果一样二...

【Linux学习笔记28-3】Shell文本处理工具之 awk

weixin_46069582的博客

12-22

179

文章目录1. awk简介2. awk命令3. awk 用法示例4. 测试 1. awk简介 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(stdin)、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。awk有很多内建的功能，比如数组、函数等，这是它和C语言的相同之处，灵活性是awk最大的优势 2. awk命令基本结构： awk '

参与评论您还未登录，请先登录后发表或查看评论

Linux-awk命令详解及使用方法

张艳霞

07-20

2056

awk（针对列） 1.语法格式：awk [选项] ‘[条件]{指令}’ 文件名 1）指定空格为分隔符指令：print # awk ‘{print $1,$3}’ a.txt 2）指定冒号：为分隔符选项：-F ：指定分隔符 # awk -F : ‘{print $7}’ /etc/passwd 3）指定/为分隔符，将分为五部分，提取bin为第三列 /usr/bin/echo/bash [root@zhang ~]# awk -F / ‘{print $3}’ a.txt [root@zh

awk基本用法

denf76097的博客

04-26

444

shell 脚本编程 #################################### 回顾： sed 文本编辑器，逐行处理，非交互 sed [选项] ‘条件指令’ 文件选项： -n 屏蔽默认输出 -i 修改原文件 -r 支持扩展正则条件：行号，/正则/ 指令：增删改查 a 行前面写入 i 行后面写入 d 删除行 dd s...

详解sed命令与awk命令

m0_56145255的博客

08-14

2016

awk是专门为文本处理设计的编程语言，是一门数据驱动的编程语言，与sed类似都是以数据驱动的行处理软件，主要用于数据扫描、过滤、统计汇总工作，数据可以来自标准输入，管道或者文件。

AWK命令详解

weixin_30739595的博客

05-07

138

说明：awk命令和sed命令一样，也是逐行扫描文件的，从第一行到最后一行，寻找匹配特定模板的行，并在这些行上运行“选择”动作。如果一个模板没有指定动作，这些匹配的行就被显示在屏幕上。如果一个动作没有模板，所有被动作指定的行都被处理。 1、awk的基本格式： awk 'pattern' filenameawk '{action}' filenameawk 'pattern {action}' f...

shell 里 awk print 的用法

weixin_44898311的博客

09-10

4231

首先，你需要先了解awk 的工作原理: 1。AWK读取输入文件一次一行。 2。对于每一行，它匹配在给定的顺序模式，如果匹配，执行相应的动作。 3。如果没有模式匹配，将执行任何行动。 4。在上面的语法，无论是搜索模式，或行动是可选的，但不能同时。 5。如果没有给出搜索模式，然后awk要执行每一行输入给定的行动。 6。如果没有给出动作，打印，这是默认的操作与模式相匹配的所有行。 7。空出的任何行动括号什么都不做。它不会执行默认的打印操作。 8。中的每个行动的声明应该用分号分隔。让我们创建employee.tx

awk分析web日志

jingzhiz 专属移动笔记

02-13

514

具体情况还得根据自己的nginx、apache日志格式来定，仅供参考。 1、查看有多少个IP访问 awk '{print $1}' log_file|sort|uniq|wc -l 2、查看某一个页面被访问的次数 grep "/index.php" log_file | wc -l 3、查看每一个IP访问了多少个页面 awk '{++S[$1]} END {for (a in S)...

shell浅谈之七文本处理工具grep、sed、awk.docx

最新发布

11-23

在Linux世界中，Shell脚本提供了许多强大的工具，其中grep、sed和awk是文本处理的三大利器。它们各自有着独特的用途，但又相互关联。在本文中，我们将深入探讨grep命令，以及它如何帮助理解sed和awk。 grep，全称...

shell工具之awk

01-09

shell工具之awk 一个强大的文本分析工具，把文件逐行的读入，以空格为默认的分割符并将每行切片，切开的部分在进行分析处理。 1.基本用法 awk [选项参数] ‘pattern1 {action} pattern2 {action}…’ filename ...

浅谈awk的基本用法

weixin_30439067的博客

02-04

167

awk 1.域和记录: 取第一域，并在开头和结尾加字符begin和end 通常使用BEGIN来显示变量和预置变量，使用END来输出最终结果。 awk'BEGIN{print"being"}{print$1}END{print"end"}'file 2.条件操作符: 第一字域，包含expect，就打印整行 awk'{if($1~/expect/...

linux awk输出后两个,关于linux：awk打印列$ 3如果$ 2 ==具体值？

weixin_35969257的博客

05-14

1275

我正在从awk编程语言中学习awk，并被这个例子所困扰。如果我想打印$ 3如果$ 2等于一个值(例如'1')，我正在使用这个命令工作正常：awk '$2==1 {print $3}' | more但是当我用另一个搜索条件替换1时，例如'findtext'，这个命令不起作用。awk '$1== findtext {print $3}' | more这没有返回任何输出，我确定我放在'findtex...

服务器清理内存shell脚本

qq_42422698的博客

06-24

690

1 脚本原件： #! /bin/bash #说明 #echo 1 > /proc/sys/vm/drop_caches:表示清除pagecache，当前产链服务器缓存主要在这里。 #echo 2 > /proc/sys/vm/drop_caches:表示清除回收slab分配器中的对象（包括目录项缓存和inode缓存）。slab分配器是内核中管理内存的一种机制，其中很多缓存数据实现都是用的pagecache。 #echo 3 > /proc/sys/vm/drop_caches:表示清除

awk、print使用

飞的博客

08-02

9098

代码】awk、print使用。

awk '{print $2}' 这个命令