Linux“三剑客”——grep sed awk

众所周知,linux一切皆文件,对linux的操作,即是对文件的处理,这三个工具便能更加方便的处理文件

grep擅长查找功能
sed擅长取行和替换
awk擅长取列

1、grep

文本过滤(模式:pattern)工具,grep,egrep

grep [options] pattern [file…]

--color=auto 对匹配到的文本着色显示
-v 显示不被pattern匹配到的行
-i 忽略字符大小写
-n 显示匹配的行号
-c 统计匹配的行数
-o 仅显示匹配到的字符串
-q 静默模式,不输出任何信息
-A # after, 后#行
-B # before, 前#行
-C # context,前后各#行
-e 实现多个选项间的逻辑or关系
	grep -e 'cat' -e 'dog' file
-W 匹配整个单词
-E 使用ERE,相当于egrep
-F 相当于fgrep,不支持正则

exp:

1.查找文件内容包含root的行数
grep -n root file
2.查找文件内容不包含root的行数
grep -nv root file
3.查找以s开头的行
grep -n ^s file

2、sed

sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使用诸如 ‘D’ 的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出

sed [options] … ‘script’ inputfile

1.选项
	-n 不输出模式空间内容到屏幕,即不自动打印
	-e 多点编辑
	-f /PATH/SCRIPT_FILE 从指定文件读取编辑脚本
	-r 支持使用扩展正则表达式
	-i 直接编辑文件
	-i.bak 备份文件并原处编辑
script 地址定界
	1 不给地址: 对全文进行处理
	2 单地址:
		#:指定的行, $:最后一行
		/pattern/: 被此处模式所能够匹配到的每一行
	3 地址范围:
	#,#
	#,+#
	/pat1/./pat2/
	`#,/pat1/
	4 ~: 步进
		1~2 奇数行
		2~2 偶数行
3.编辑命令:
	d 删除模式空间匹配的行,并立即启用下一轮循环
	p 打印当前模式空间内容,追加到默认输出之后
	a[\]text 在指定行后面追加文本,支持使用\n 实现多行追加
	i[\]text 在行前面插入文本
	c[\]text 替换行为单行或多行文本
	w /path/somefile 保存模式匹配的行至指定文件
	r /path/somefile 读取指定文件的文本至模式空间中匹配到的行后
	= 为模式空间中的行打印行号
	!模式空间中匹配行取反处理
	s/// 查找替换,支持使用其他分隔符,s@@@,s###
		替换标记:
			g 行内全局替换
			p 显示替换成功的行
			w /path/somefile 将替换成功的行保存至文件中 

exp

打印文件第二行
sed -n 2p file
打印文件2-5行内容
sed -n 2,5p file
将文件中的root全部替换为abc
sed -i 's/root/abc/g' file

3、awk

报告生成器,格式化文本输出,有多种版本:nawk, gawk

awk [options] ‘program’ file…
program:pattern{action statements;…}

1、pattern部分决定动作语句何时触发及触发事件
			BEGIN,END
2、action statements对数据进行处理,放在{}内指明
			print, printf

选项:

-F 指明输入时用到的字段分隔符
-v var=value 自定义变量

分割符、域和记录:

awk执行时,由分隔符分隔的字段(域)标记1,1,2..n称为域标识,n称为域标识,0为所有域。
	省略action,则默认执行 print $0 的操作。

变量

FS:输入字段分隔符;OFS:输出字段分隔符;RS:输入记录分隔符;ORS:输出记录分隔符;NF:字段数量;
NR:记录号;NFR:各文件分别计数,记录号。FILENAME:当前文件名;ARGC:命令行的参数;ARGV:数组,
保存的是命令行所给定的各参数。

注意:以上都是内置变量,在引用时不需要前面加$,每新建一个变量,都需要加个-v,与变量名之间有无空格都可以,变量可以在引用之后再声明,但那一行的输出会输出空行。

printf命令

printf “FORMAT” , item1, item2, ... 不会自动换行,FORMAT中需要分别为后面每个item指定格式符。

PATTERN

根据pattern条件,过滤匹配的行,再做处理

如果未指定:空模式,匹配每一行

/regular expression/:仅处理能够模式匹配到的行,需要用/ /括起来

relational expression: 关系表达式,结果为“真”才会被处理

line ranges:行范围 startline,endline:/pat1/,/pat2/不支持直接给出数字格式

BEGIN/END模式

exp

打印文件第一列
awk -F ':' '{print $1}' file
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值