awk字符串处理

1.gsub
gsub(r,s,t) 在整个t中用s替代r
gsub(r,s) 在整个$0中用s替代r。t缺省为$0
要在整个记录中替换一个字符串为另一个,使用正则表达式格式, /目标模式/,替换模式。例如改变学生序号4842到4899:
# awk 'gsub(/4842/,4899){print $0}' grade.txt

2. index
index(s,t):函数返回目标字符串s中查询字符串t的首位置。必须用双引号将字符串括起来。
# awk 'BEGIN {print index("Bunny","ny")}' grade.txt

3. length
length(s) :返回s长度

4. match
match(s,r): 测试s是否包含匹配r的字符串
可以对查找部分使用正则表达式,返回值为成功出现的字符排列数。如果未找到,返回0,

5. split
split(s,a,fs) 以fs非分隔符,将s分成序列a
工作方式如下:如果有一字符串,包含一指定分隔符-,例如AD2-KP9-JU2-LP-1,将之划分成一个数组。使用split,指定分隔符及数组名。此例中,命令格式为("AD2-KP9-JU2-LP-1",parts_array,"-"),split然后返回数组下标数,这里结果为4。

6. sub
sub(r,s,n)在n中最左边最长的子串s代替r,n缺省为$0
使用sub发现并替换模式的第一次出现位置。可以使用正则表达式。字符串STR包含'poped popo pill',执行下列sub命令sub(/op/,"OP",STR)。模式op第一次出现时,进行替换操作,返回结果如下:'pOPed pope pill'。

7. substr
substr(s,p) 返回字符串s中从p开始的部分
substr(s,p,n) 返回字符串s中从p开始长度为n的部分。
substr是一个很有用的函数。它按照起始位置及长度返回字符串的一部分。例子如下:


8. 从shell中向awk传入字符串
使用管道将字符串传入awk
# STR="mydoc.txt"
# echo $STR|awk '{print substr($STR,1,5)}'
mydoc

9.特殊字符串
如果使用正则表达式,查询花括号({ }),在字符前加反斜线,如/\{/,将在awk中失掉其特殊含义。
awk中使用的特殊字符串
\b 退格键
\t tab键
\f 走纸换页
\ddd 八进制值
\n 新行
\c 任意其他特殊字符,例如\ \为反斜线符号
\r 回车键

10.sprint
sprint (fmt,exp) :函数类似于printf函数(以后涉及),返回基本输出格式fmt的结果字符串exp。
目前为止,所有例子的输出都是直接到屏幕,除了tab键以外没有任何格式。awk提供函数printf,拥有几种不同的格式化输出功能。例如按列输出、左对齐或右对齐方式。
每一种printf函数(格式控制字符)都以一个%符号开始,以一个决定转换的字符结束.转换包含三种修饰符。
printf函数基本语法是printf([格式控制符],参数),格式控制字符通常在引号里。

printf修饰符
- 左对齐
Width 域的步长,用0表示0步长
.prec 最大字符串长度,或小数点右边的位数
awk printf格式
%c ASCII字符
%d 整数
%e 浮点数,科学记数法
%f 浮点数,例如(1 2 3 . 4 4)
%g awk决定使用哪种浮点数转换e或者f
%o 八进制数
%s 字符串
%x 十六进制数

字符转换

格式化输出


修改自:http://czmmiao.iteye.com/blog/1885280

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值