awk截取字符串

5 篇文章 0 订阅

分隔字符串分三种情况,一种是分隔符是空格,一种是非空格,还有一种是多个字符作为分隔符

先来创建一个文件吧:

[plain]  view plain copy
  1. Nam   Chinese     Math       English  
  2. Tom      80        90           100  
  3. Jack     83        88           90  
  4. Lilei    84        80           88  
注意:这个文件是用空格分隔的,所以字段之间的空格数目不一样

我们想要查看每个人的English成绩,则可以用

[plain]  view plain copy
  1. awk '{print $1 "\t" $4}' student.txt   


可以看到,最后全部列出了所有人的English成绩,由此可见,在使用空格分隔是,连续的空格会当做一个分隔符来处理,那么对于别的分隔符呢?我们来看看

首先来看看指定分隔符的用法:

将文件修改成用:分隔

[plain]  view plain copy
  1. Nam:Chinese:Math:English  
  2. Tom:80:90:100  
  3. Jack:83:88:90  
  4. Lilei:84:80:88  

然后执行

[plain]  view plain copy
  1. awk -F ':' '{print $1"\t"$4}' student.txt  

可见,和上面输出是一样的,所以可以通过 -F来指定分隔符,除此之外,FS也可以指定分隔

[plain]  view plain copy
  1. awk '{FS=":"} {print $1 "\t" $4}' student.txt  
输出结果:


成绩是输出了,但是名字好像没有被分隔,事实上,awk的用法是 awk '条件1{动作1} 条件2{动作2}'  文件名,但是在执行这些动作的时候已经把行读取了,所以应该在读取之前就指定分隔符,所以用BEGIN

[plain]  view plain copy
  1. awk 'BEGIN {FS=":"} {print $1 "\t" $4}' student.txt  


最后结果也一样,所以说在指定分隔符的时候可以用-F也可以用FS,需要注意的是用FS时要加上BEGIN。好了,回到前面,当有多个非空格分隔符呢?来试试,把文件修改成如下:

[plain]  view plain copy
  1. Nam::Chinese::Math::English  
  2. Tom::80::90::100  
  3. Jack::83::88::90  
  4. Lilei::84::80::88  

然后执行

[plain]  view plain copy
  1. awk -F ':' '{print $1 "\t" $4}' student.txt  


可以看到,并没有输出我们想要的结果!

那就是试试::

[plain]  view plain copy
  1. awk -F '::' '{print $1 "\t" $4}' student.txt  


这次得到了想要的输出,由此可见,在只用空格作为分隔符是,中间的多个空格都会当做一个分隔来处理,当使用别的空格符是,指定几个分隔符就按几个来分隔。

所以这里我们可以使用简单的正则来处理:

正则中 * 表示前面的字符出现任意次(包含0),所以在有多个分隔符时我们可以用*开匹配:

[plain]  view plain copy
  1. awk -F ':*' '{print $1 "\t" $4}' student.txt  
这就是说分隔符是 : 或是 :: 或是 ::: 或是::::等等

最后得到了正确的输出

既然可以用正则,那就可以使用多个不同的分隔符,将文件改成如下:

[plain]  view plain copy
  1. Nam:/Chinese:;Math<>>>>English  
  2. Tom/80/90::100  
  3. Jack/83/88<>90  
  4. Lilei::84::80<<<88  

然后执行

[plain]  view plain copy
  1. awk -F '[:/;<>]*' '{print $1 "\t" $4}' student.txt  

好吧,很黄很暴力,但结果确实是正确的!


除此之外,awk还可以用substr来截取字符串,如下截取日期:

[plain]  view plain copy
  1. #!/usr/bin/bash  
  2.   
  3. date=`date +%Y%m%d`  
  4.   
  5. year=`echo $date | awk '{print substr($date, 0, 4)}'`  
  6. month=`echo $date | awk '{print substr($0, 5, 2)}'`  
  7. day=`echo $date | awk '{print substr($date, 7, 2)} '`  
  8. echo $date  
  9. echo $year  
  10. echo $month  
  11. echo $day  

这里有用到了两个函数,date和awk substr,date用来获取日期,其余的用法还有

获取明天的日期
date -d next-day +%Y%m%d

获取昨天的日期
date -d last-day +%Y%m%d

获取上个月的年和月
date -d last-month +%Y%m

获取下个月的年和月
date -d next-month +%Y%m

获取明年的年份
date -d next-year +%Y

在获取非当前日期时需要加上-d参数,另外还可以指定时分秒

比如:echo `date +%Y%m%d-%H:%M:%S`,在格式化日期的时候只有月和日是小写,其余都是大写。

awk中常用的函数:

  • 3
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: 可以使用 `cut` 命令来截取字符串。例如: ``` $ echo "hello world" | cut -c 1-5 hello ``` 该命令表示将字符串 "hello world" 截取前 5 个字符,即 "hello"。 也可以使用 `sed` 命令来截取字符串。例如: ``` $ echo "hello world" | sed 's/\(^.\{5\}\).*/\1/' hello ``` 该命令表示将字符串 "hello world" 从开头截取 5 个字符,即 "hello"。 还可以使用 `awk` 命令来截取字符串。例如: ``` $ echo "hello world" | awk '{print substr($0,1,5)}' hello ``` 该命令表示将字符串 "hello world" 从1开始截取5个字符,即 "hello"。 ### 回答2: Shell 是一种命令行解释器(或者称为 shell 解释器),常用语法是通过键盘输入命令,然后由解释器执行操作。 在 Shell 中,有时候需要对字符串进行截取或者分割,以获取需要的部分数据,这就需要使用字符串截取操作。 字符串截取操作最基本的两种方式是: - 使用 `${string:position:length}` 的方式进行截取; - 使用 `${string#substring}` 或 `${string##substring}` 的方式进行截取。 其中,第一种方式可以根据位置和长度截取需要的子串,例如: ```bash # 获取 "hello world" 字符串中的前 5 个字符 echo ${"hello world":0:5} # 获取 "hello world" 字符串中的后 5 个字符 echo ${"hello world":(-5)} ``` 第二种方式则是根据子串进行截取,其中 `${string#substring}` 是从字符串的开头删除最短的匹配,`${string##substring}` 则是从字符串的开头删除最长的匹配。例如: ```bash # 从 "hello world" 中删除 hello,只剩下 world echo ${"hello world"#"hello "} # 从 "hello world" 中删除 hello,只剩下 world echo ${"hello world"##"hello "} ``` 以上就是 Shell 中处理字符串的两种基本截取方式。当然,除此之外,还有很多其他的字符串处理方法,例如使用 sed 等工具,可以更加灵活地处理字符串。 ### 回答3: 在Shell中截取字符串是一项十分常用的技能,我们可以使用内置函数来进行字符串的截取,包括字符切割和正则表达式匹配。下面将具体介绍Shell中常用的字符串截取方法。 1. 字符切割 使用字符切割是最简单的字符串截取方法,在Shell中,我们可以使用“${变量名/模式/替换}”的形式来实现。具体方法如下: 例如,我们有一个字符串“string=hello,world”,要截取其中的“world”,可以使用以下命令: ``` echo ${string#*,} ``` 在这里,“#”号表示从左边开始删除第一个匹配的“,”号及其前面的所有字符,结果为“world”。 2. 正则表达式匹配 正则表达式匹配适用于需要对字符串进行更复杂的匹配操作,比如需要截取一些特定的字符或字符串。在Shell中,使用“=~”符号来进行正则表达式匹配,具体方法如下: 例如,我们有一个字符串“string=hello world”,要截取其中的“hello”,可以使用以下命令: ``` regexp='^([a-z]+)' [[ $string =~ $regexp ]] && echo ${BASH_REMATCH[1]} ``` 在这里,我们将正则表达式“^([a-z]+)”赋值给一个变量“regexp”,表示以小写字母开头的字符串,然后通过=~符号将字符串和正则表达式进行匹配。如果匹配成功,则BASH_REMATCH数组会按顺序存储匹配的结果,我们可以通过数组下标来获取具体的匹配结果。在这里,BASH_REMATCH[0]表示整个匹配结果,“hello”,BASH_REMATCH[1]表示第一个捕获分组的匹配结果,“hello”。 总之,截取字符串是Shell中常用的操作之一,通过掌握上述的方法,可以方便地对字符串进行截取和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值