Awk里的域赋值操作和部分源码解析（$1=$1,$0=$0,FS,OFS)

最新推荐文章于 2023-08-05 21:45:18 发布

原创

最新推荐文章于 2023-08-05 21:45:18 发布 · 7k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#null #parsing #数据结构 #reference #pointers #tree

本文详细分析了awk中的$1=$1和$0=$0的用途和原理。$1=$1会触发记录在下次引用$0时按OFS重构，改变输出分隔符；而$0=$0会根据FS重新分割记录，改变输入分隔符。这两种赋值操作涉及到记录分割和重构，是awk中重要的字段处理技巧。

前言：

cu上出了个shell题：

http://bbs.chinaunix.net/thread-2319120-1-1.html

第八题：GNU awk的$1=$1到底有什么作用？$0=$0呢？

这题问得相当的细致。可能很多人已经常用这二个赋值语句，却半知半解。以下分二部分对这个题目进行分析

建议没心情，没耐心，没兴趣的人，只需要了解下第一部分，看第二部分就表看了，很罗嗦的。

第一部分：能过man上边的解析，回签这二个赋值语句的功能

第二部分：awk部分源码解析（结点树简介，及域模块)

通过分析awk 域模块源码，了解awk的内部处理机制

参考程序及源码版本：gawk-3.1.5

=========================第一部分================================================

第一部分：GNU awk的$1=$1到底有什么作用？$0=$0呢？

首先了解一下一些知识，先翻一下man awk里的这段话：

assigning to a non-existent field (e.g., $(NF+2) = 5) increases the value of NF,

对不存在的域赋值，会增加NF值

creates any intervening fields with the null string as their value,

中间域默认为NULL字符串

and causes the value of $0 to be recomputed, with the fields being separated by the value of OFS.

$0会被根据OFS值重新计算，

References to negative numbered fields cause a fatal error.

引用负的域索引是无效的，并且会导致错误

Decrementing NF causes the values of fields past the new value to be lost,

减少NF值时，索引大于NF的域将会丢失

and the value of $0 to be recomputed, with the fields being separated </

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。