第十二章 正则表达式与文件格式化处理
sed
sed [-nefr] [动作]
动作说明:[n1[,n2]]function
n1,n2:不见得会存在,一般代表选择进行行动作的行数,举例来说,如果我的动作是需要再10到20行之间进行的,则“10,20[动作行为]”
动作行为:
a:新增,a后面可以接字符串,这些字符串会在新的一行出现(目前的下一行)
c:替换,c后面可以接字符串,这些字符可以替换n1,n2之间的行
d:删除,后面不需要接参数
i:插入,i后面可以接字符串,这些字符串会在新的一行出现(目前的上一行)
p:打印,将某个选择的数据打印出来,通常p会与参数sed -n一起运行
s:替换,搭配正则表达式使用,如1,20s/old/new/g
awk
awk ‘条件类型1{动作1} 条件类型2{动作2}……’ filename
- 单双引号
awk后续的所有动作都是以单引号括住的,如果想以print打印时,所有非变量的文字部分,都需要使用双引号来定义出来。 - 分隔符
主要处理每一行的字段内的数据,而默认的字段的分隔符为空格键或tab键。 - 变量
$0表示一整行数据的意思,$1表示第一个字段,$2表示第二个字段…… - 内置变量
awk的内置变量有:
NF:每一行($0)拥有的字段总数
NR:目前awk所处理的是“第几行”数据
FS:目前的分隔字符,默认是空格键
🌰last -n 5 | awk ‘{print $1 "\t lines: " NR "\t columes: " NF}’ - 条件类型中可以加入逻辑运算符
🌰cat /etc/passwd | awk ‘{FS=":"} $3 < 10 {print $1 "\t " $3}’
上面的例子设置分隔符为冒号,当第三个变量小于10的时候,输出第一个和第三个变量。
但是运行时发现第一行不符合条件也会输出,这是因为这样设置FS只能在第二行开始生效,如果需要在第一行就生效,需要用预设置命令 - 预设awk变量 BEGIN
🌰cat /etc/passwd | awk ‘BEGIN {FS=":"} $3 < 10 {print $1 "\t " $3}’
diff
以行为单位进行比较
可以比较整个目录下的区别
diff [-bBi] from-file to-file
-b:忽略一行中仅有多个空白的区别
-B:忽略空白行的区别
-i:忽略大小写的不同
cmp
以字节为单位进行比较