Grep、sed、awk被称为linux中的 “三剑客”。
三者各有特长,具体见下:
Grep:更适合单纯的查找或匹配文本
Sed:更适合编辑匹配到的文本
Awk:更适合格式化文本,对文本进行较复杂的格式处理
Awk命令格式:awk –v FS=’#’ –v OFS=’—’ ‘BEGIN {print “aa” ,“bb”} END {print #NR&FNR $1,$2 }’ test
Fs处可为输入/出字段分隔符,也可为输入输出分割记录符(RS,ORS),自变量定义
Begin:在对每一行进行处理之前,初始化代码,引用全局变量,设置分隔符
End:结尾代码块,对每一行处理之后再执行的代码块
NR显示行号时,多个文件回按照顺序进行排序;
FNR显示行号时,分别对每个文件进行计数
FILENAME:当前文件名
ARGC:命令行参数的个数
ARGV:数组,保存的是命令行多给定的参数
\n:换行的作用
正则通用符号:
使用{X}表示之前的字符连续出现X次的将被匹配到,使用{,X}表示之前的字符出现0-X次,使用{X,}表示之前的字符最少出现X次;
“”表示之前的字符出现任意次数;
“.”表示任意长度的任意字符
“.”表示匹配任意单个字符
?:表示匹配其前面的字符0或1次,就是前面的字符要么没有,要么有一个;
+:表示匹配其前面的字符至少一次,就是前面的字符必须有至少一个;
[[:alpha:]]表示任意大小写字母,等价于[a-zA-Z]
[[:lower:]]表示任意小写字母,等价于[a-z]
[[:upper:]]表示任意大写字母,等价于[A-Z]
[[:digit:]]表示0到9之间的任意单个数字,等价于[0-9]
[[:alnum:]]表示任意数字或字母
[[:space:]]表示任意空白字符,包括“空格”、“tab键”等
[[:punct:]]表示任意标点符号
[]:在正则表达式中匹配指定范围内的任意单个字符
[^]:表达范围外的任意单个字符
分组:把某个对象当做整体(如(hello){2},最后匹配两次hello)
后向引用,见下图:
经典实例(选ipv4):
实例分析:红线区域表示选取一到三位数字的字符串,.表示转义为普通的“.”;
蓝色区域表示之前的字符串连续出现3次;
绿色区域表示1-3位的字符串出现一次