awk从放弃到入门(4):awk格式化

本文详细介绍了awk中的printf命令及其格式化功能,对比了它与echo命令的区别,展示了printf的灵活性和格式替换符的使用,包括%s、%f等,并探讨了awk中的printf动作的特性和注意事项。
摘要由CSDN通过智能技术生成

awk从放弃到入门(4):awk格式化

本博文转载自

之前的文章举过很多例子,我们也体验到了awk的格式化能力,但是我们的体验并不全面,所以,现在,我们来更加深刻的了解一下awk的格式化能力,在前文的举例中,我们在使用awk时,通常使用print 对文本进行输出,但是动作print 只能实现简单的文本输出功能,并不能对文本格式进行改变,如果想要改变文本的格式,则需要awk中的另一个动作,此动作与print很像,它就是printf,没错,看到printf,你肯定会想到printf命令,或者想到了C语言中的printf()函数,如果你想到了这些,那么使用printf对你来说应该不在话下了,如果你并没有接触过printf命令或者printf()函数,没有关系,你可以先阅读如下连接对应的文章,即可学会printf命令的使用方法

printf命令详解

如果你是一个使用过C语言的程序员,那么你一定会很容易理解printf命令,printf命令模仿了C语言中printf( )函数。

即使你没有用过C语言和printf()函数,看完这篇文章以后,你也会很快的掌握printf命令的用法。

printf命令的主要作用就是输出文本,不不不,这样说并不准确,应该说,printf命令的作用是按照我们指定的格式输出文本。

而提到输出文本,你一定会想到另一个常用命令,echo命令,echo命令我们已经总结过,此处不再赘述,我们来对比一下,echo与printf有什么不同

在这里插入图片描述
从上述示例中可以看出,在输出文本时,echo命令会对输出的文本进行换行,而printf命令则不会对输出的文本进行换行,那么,如果我们想要利用printf将输出的文本换行,应该怎么做呢?没错,聪明如你一定想到了,使用转义符\n ,示例如下
在这里插入图片描述
看到这里你可能会说,这样多麻烦,还不如直接使用echo命令比较方便,没错,如果只是就输出功能而言,它们并没有什么不同,但是,刚才已经强调过,printf的优势在于格式化输出文本,那么,我们就来通过一个小例子,来见识一下printf的格式化输出文本的能力。

假设,我们有一串文本需要输出,如下
在这里插入图片描述
现在我们有一个小需求,就是将上述文本按照空格分段,每段单独输出在一行里面。

当然,有很多方法可以实现上述要求,假设我们并不会使用其他命令,也不是特别会写脚本,那么我们可能会使用一些笨办法进行输出,比如,使用下图中的命令1或者命令2
在这里插入图片描述
上述示例中,命令1与命令2在输出文本时,都使用了转义字符\n将文本换行了,但是,在写命令1与命令2的时候,我的内心是崩溃的,因为,上述示例还算简单,我只是将5段文本分成5行输出即可,但是,如果是一个100段的文本呢?难道我们要在每一段中都添加一个转义字符”\n”,那我的手不就打残了,而命令3则不同,我只是通过printf指定了一个固定的”格式”,后面的每一段文本都按照指定的格式进行了换行,即使有10000段文本需要换行,我也不用担心手残的问题了,从这个小例子中,我们就能体会到printf的格式化能力,上图中命令3中使用到的”格式”会在后面进行详细的描述,不要着急。

说到这里,我发现我们还没有写出printf命令的使用语法,printf命令的语法如下

printf “指定的格式” “文本1” “文本2” “文本3” ……

还记得刚才的命令3吗?现在,我们对比着命令3和语法一起看,会更加明了。

在这里插入图片描述
聪明如你一定想到了,上述语法中的每一个”文本”都会被当做参数项传入printf命令,而每个被传入的参数都会按照指定的”格式”被”格式化”。

没错,命令3中的”%s\n”即为我们指定的”格式”,而后面的每一段字符串,都被当做参数传入到了printf命令中,并按照我们指定的格式进行了格式化。那么,我们现在来详细的解释一下上图中的”%s\n”是什么意思。

我们先说说”%s”是什么意思,”%s”是一个”替身演员”,我们使用”%s”代替传入的参数,也就是说, “%s”代替了命令3中的abc,代替了def,代替了ghi,代替了每一个传入的参数,在我们指定的”格式”中,它代表了每一个传入的参数,所以,如果我们指定的格式为”%s\n”,当abc被当做参数传入printf命令时,printf就会把”%s\n”中的%s替换成abc,于是,abc就变成了我们指定的格式”abc\n”,最终printf输出的就是格式化后的”abc\n”,以此类推,每一段文本都被当做一个参数传入printf命令,然后按照指定的格式输出了。

而”替身演员”只是我给”%s”起的一个外号,它的真名叫”格式替换符”,而printf中,”格式替换符”不只有”%s”一种,”%s”代替了每一个传入的参数,并将他们转化成了”字符串类型”,我们再来认识一个新的替身演员,”%f” ,”%f”也代替了每一个传入的参数,与”%s”不同的是,”%f”会将每一个传入的参数转换成”浮点类型”,我们来看一个小例子。

在这里插入图片描述
上例中,我们分别使用了”%s”替换符和”%f”替换符格式化了相同的内容,但是格式化后的结果却不同。

“%f”自动将传入的数字添加了小数点,将传入的数字参数替换成了浮点数。

聪明如你一定想到了,我们可以根据传入参数的不同,使用不同的”格式替换符”去替换。

那么,还有哪些格式替换符呢?常用的格式替换符总结如下。

%s 字符串

%f 浮点格式(也就是我们概念中的float或者double)

%b 相对应的参数中包含转义字符时,可以使用此替换符进行替换,对应的转义字符会被转义。

%c ASCII字符。显示相对应参数的第一个字符

%d, %i 十进制整数

%o 不带正负号的八进制值

%u 不带正负号的十进制值

%x 不带正负号的十六进制值,使用a至f表示10至15

%X 不带正负号的十六进制值,使用A至F表示10至15

%% 表示”%”本身

说完了”格式替换符”,再来说说”转义字符”,刚才的示例中,我们只用到了”\n”这个转义符,还有很多其他的转义符,printf中的转义字符与其他程序中的转义字符没有什么不同,此处我们只是总结出来,方便大家使用。printf常用的转义符如下。

\a 警告字符,通常为ASCII的BEL字符

\b 后退

\c 抑制(不显示)输出结果中任何结尾的换行字符(只在%b格式指示符控制下的参数字符串中有效),而且,任何留在参数里的字符、任何接下来的参数以及任何留在格式字符串中的字符,都被忽略

\f 换页(formfeed)

\n 换行

\r 回车(Carriage return)

\t 水平制表符

\v 垂直制表符

\ 一个字面上的反斜杠字符,即”\”本身。

\ddd 表示1到3位数八进制值的字符,仅在格式字符串中有效

\0ddd 表示1到3位的八进制值字符

printf的格式化功能我们还没有说完,先别急着关闭这个网页,继续往下看。

现在,我们已经会基本的使用printf命令了,但是还有很多东西没有细聊,在”深入”之前,我们先”浅出”一下,把刚才的知识应用一遍,动手做一些小例子,为后面的知识点打下坚实的基础。

假设,我想为每个传入的参数添加一对”括号”,并且括号内侧需要有空格,那么我们可以使用如下命令。

在这里插入图片描述

假设,我们想要将每个传入的参数使用”制表符”隔开,那么,可以使用如下命令。
在这里插入图片描述
好了,我知道你的动手能力一定比我强,所以,你自己玩吧,之前的知识点随便试,我就不再瞎BB了。

现在,我们继续聊printf。

刚才的举例中,我们使用到的”格式”其实很简单,每个”格式”中都只用到了一个”格式替换符”,现在,我们扩展一下,在格式中设置多个”格式替换符”试试,示例如下
在这里插入图片描述
看完上图,聪明如你一定想到了,我们所指定的”格式”中所包含的”格式替换符”的数量,就代表每次格式化的参数的数量,每个”格式替换符”与参数都是一一对应的,上图中,指定的”格式”中包含两个”格式替换符”,那么printf每次进行”格式化”操作时,就会传入两个参数,然后前一个参数对应第一个替换符,后一个参数对应第二个替换符,当本次格式化操作完成以后,再传入下一波参数,示意图如下

在这里插入图片描述
那么,我们再验证一遍上述理论,把之前的格式改为如下图中的模样
在这里插入图片描述
按照之前的理论,因为”格式”中包含3个”格式替换符”,所以每轮格式化都可以一次性格式化3个参数,于是,第一次格式化操作将”%s %s %s\n”替换成了”a b c\n”,第二次格式化操作将”%s %s %s\n”替换成了”d e f\n”,格式化后的输出入上图所示。

好了,我们再看一个例子,跟上例其实没有区别,只是传入的数据更贴合实际,所以格式化后的数据可读性更高了。

在这里插入图片描述
如果你跟我一样,有所谓的强迫症,那么你对上图中的格式化效果肯定不满意,上图中,被格式化以后的数据虽然可读性更高了,但是并没有完全对齐,”年龄”字段对应的数字都快跑到”性别”字段里面了,这怎么能忍?其实我就是说说,真忍也就忍了。不过咱们也可以不这么委屈自己,因为printf有能力”满足”这样的”需求”。(嗯~~~说这句话的时候我想歪了)

我们看看,printf是怎样拯救强迫症患者的,示例如下。
在这里插入图片描述
我们只是在原来的”格式替换符”中间加入了特定的数字,貌似显示效果就比刚才好了一点,起码年龄字段对应数字与”年龄”两个字对齐了。那么这些数字是什么意思呢?上图中第一个”%7s”中间的7表示当前替换符对应的输出宽度为7个字符宽,如果对应的输出不足7个字符,则用空格补全,如果输出的长度超过7个字符,超出的部分也会显示。同理”%5s”表示当前替换符对应的输出宽度为5个字符的宽度。而这些数字,我们可以将其称之为”修饰符”,修饰符会对相应的”替换符”进行修饰。

神马?看右对齐不顺眼,想要左对齐?好吧,满足你!看下图。
在这里插入图片描述
与之前的”格式”相比,只是在原来的修饰符前面加入了”-“,”-“表示左对齐,默认不加”-“时表示右对齐,其实”-“也是修饰符。

除了数字和”-“,还有另一种修饰符,就是”+”

“+”可不代表右对齐,因为我们前面已经说过,不加”-“修饰符的时候,默认就是右对齐。那么”+”修饰符表示什么意思呢?看下图你就会明白。

在这里插入图片描述
如上图所示,在默认没有添加”+”作为修饰符时,烈火兽的体温输出为180,而使用了”+”修饰符以后,烈火兽的体温输出为+180,看到这里你应该明白了,当替换符对应的参数为数字时,可以使用”+”作为修饰符,输出”正数”前面的”正号”。

现在我们已经学会了3种修饰符

“数字”

“+”

“-”

其实数字修饰符还有另外的一些特殊用法,如下图所示。

在这里插入图片描述
上图中,第一条命令的数字修饰符为12,表示对应的替换符”%f”的输出宽度为12个字符,第二条命令的数字修饰符为12.3 ,表示对应的替换符”%f”的输出宽度为12个字符,并且小数点的精度为3。

没错,当替换符为”%f”时,如果数字修饰符带有小数点,则数字修饰符小数点后的数字表示对应小数精度。

而当格式替换符为”%d”时,如果数字修饰符带有小数点,则数字修饰符小数点后的数字表示整数的长度,长度不够时,高位用0补全,如下图所示。
在这里插入图片描述
好了,printf命令的用法就总结到这里。

利用awk中的printf动作,即可对文本进行格式化输出,printf动作的用法与printf命令的用法非常相似,只是有略微的不同而已,不过,我们还是从最简单的示例开始看起,首先对比一下print动作与printf动作的区别,示例如下
在这里插入图片描述
没错,printf动作与printf命令一样,都不会输出换行符,默认会将文本输出在一行里面。

聪明如你一定想到了,既然printf动作的用法与printf命令一样,那么,printf动作有没有printf命令中所谓的”格式替换符”呢?

必须有啊,”格式替换符”是什么我们就不再赘述了,因为在printf命令详解中已经详细的解释过它,那么我们来使用”格式替换符”来指定一下$1的格式,示例如下。
在这里插入图片描述
如果只看上图中红线标注的部分,你肯定会认为,这就是printf命令的用法,只是printf动作与printf命令在语法上唯一的不同点就是,在使用printf动作时,指定的”格式”与列($1)之间需要用”逗号”隔开,而使用printf命令时,指定的格式与传入的文本不需要使用”逗号”隔开,如下图所示

在这里插入图片描述
其实,它们还有一些其他的不同之处,我们在使用printf命令时,当指定的格式中只有一个”格式替换符”,但是传入了多个参数时,那么这多个参数可以重复的使用这一个格式替换符,示例如下

在这里插入图片描述
但是在awk中,我们则不能这样使用,在awk中,格式替换符的数量必须与传入的参数的数量相同,换句话说,格式替换符必须与需要格式化的参数一一对应,示例如下。
在这里插入图片描述
好了,这就是awk中printf动作在使用时的一些注意点。

我们来总结一下,在awk中使用printf动作时,需要注意以下3点。

1)使用printf动作输出的文本不会换行,如果需要换行,可以在对应的”格式替换符”后加入”\n”进行转义。

2)使用printf动作时,”指定的格式” 与 “被格式化的文本” 之间,需要用”逗号”隔开。

3)使用printf动作时,”格式”中的”格式替换符”必须与 “被格式化的文本” 一一对应。


好了,我们来看一些小示例,练练手。

我们可以利用格式替换符对文本中的每一列进行格式化,示例如下。
在这里插入图片描述
我们可以利用awk的内置变量FS,指定输入字段分隔符,然后再利用printf动作,进行格式化,示例如下。
在这里插入图片描述
上例完美的体现了awk的格式化能力,因为awk本身负责文本切割,printf动作负责格式化文本,双剑合璧了。

继续扩展一下,可以利用awk的begin模式,结合printf动作,输出一个像样的表格,下图中用到的”修饰符”此处不再赘述如果不明白,参考printf命令详解

其实话说回来,只要能够灵活的使用printf命令,再结合printf动作使用时的3个注意点,即可快速灵活的掌控它,好了,关于awk的格式化能力,就暂时总结到这里,希望这篇文章能够对你有所帮助。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

前面有光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值