awk使用gsub删除字符的问题

菜鸟一粟

已于 2024-05-13 15:25:35 修改

阅读量180

点赞数 1

分类专栏： awk 文章标签： linux

于 2024-05-13 12:39:22 首次发布

本文链接：https://blog.csdn.net/MrLai_xs/article/details/138794855

版权

awk 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文件a.txt内容如下：

[root@localhost ~]# cat a.txt 
a 10ms 20ms
b 5ms  40ms
c 34ms 8ms

找第二列最小的值，则代码：

[root@localhost ~]# cat a.txt |awk '
> BEGIN{
>     minValue=1000
> }
> {
>     v = $2;
>     gsub(/ms/,"",v);
>     minValue = minValue < v ? minValue : v;
> }
> END{
>     print "====================";
>     print "minValue:",minValue;
> }'
====================
minValue: 10

上面代码输出的最小值是10，使用gsub处理后的数据，比较大小不准确了？？？

把使用内置函数gsub删除"ms"的方式修改为使用内置函数split来处理，如:

[root@localhost ~]# cat a.txt |awk '
> BEGIN{
>     minValue=1000
> }
> {
>     v = $2;
>     split(v,a,"ms");
>     v=a[1];
>     minValue = minValue < v ? minValue : v;
> }
> END{
>     print "====================";
>     print "minValue:",minValue
> }'
====================
minValue: 5

使用split进行字符的处理，能得到预期的结果。

执着于gsub为什么不行，进行了print分析：

[root@localhost ~]# cat a.txt |awk '
> BEGIN{
>     minValue=1000
> }
> {
>     v = $2;
>     print "before gsub, value:"v"#";
>     gsub(/ms/,"",v);
>     print "after gsub, value:"v"#";
>     minValue = minValue < v ? minValue : v;
> }
> END{
>     print "====================";
>     print "minValue:",minValue;
> }'
before gsub, value:10ms#
after gsub, value:10#
before gsub, value:5ms #
after gsub, value:5 #
before gsub, value:34ms#
after gsub, value:34#
====================
minValue: 10

显然a.txt的第二行的第二个字段除了包含"5ms"之外，在其末尾还有个特殊的空字符。

看来这个特殊的空字符不在awk模块的分割字符中，导致a.txt的第二行的第二个字段包含了空字符。

菜鸟一粟

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
awk使用gsub删除字符的问题

看来这个特殊的空字符不在awk模块的分割字符中，导致a.txt的第二行的第二个字段包含了转义字符。显然a.txt的第二行的第二个字段处理包含"5ms"之外，在其末尾还有个特殊的空字符。上面代码输出的最小值是10，使用gsub处理后的数据，比较大小不准确了？使用split进行字符的处理，能得到预期的结果。
复制链接

扫一扫