linux文本处理工具

一、grep

grep是行过滤工具;用于根据关键字进行行过滤

语法:
grep [选项] '关键字' 文件名

选项:

OPTIONS:
   -i: 不区分大小写
   -v: 查找不包含指定内容的行,反向选择
   -w: 按单词搜索
   -o: 打印匹配关键字
   -c: 统计匹配到的行数
   -n: 显示行号
   -r: 逐层遍历目录查找
   -A: 显示匹配行及后面多少行	
   -B: 显示匹配行及前面多少行
   -C: 显示匹配行前后多少行
   -l:只列出匹配的文件名
   -L:列出不匹配的文件名
   -e: 使用正则匹配
   -E:使用扩展正则匹配
   ^key:以关键字开头
   key$:以关键字结尾
   ^$:匹配空行

2.cut

cut是列截取工具,用于列的截取
语法:
cut 选项 文件名

选项

OPTIONS:
   -c:	以字符为单位进行分割,截取
   -d:	自定义分隔符,默认为制表符\t
   -f:	与-d一起使用,指定截取哪个区域

3.sort

sort工具用于排序;它将文件的每一行作为一个单位,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

选项:

 OPTIONS:
	-u :去除重复行
	-r :降序排列,默认是升序
	-o : 将排序结果输出到文件中,类似重定向符号>
	-n :以数字排序,默认是按字符排序
	-t :分隔符
	-k :第N列
	-b :忽略前导空格。
	-R :随机排序,每次运行的结果均不同

4.uniq

uniq用于去除连续重复

常见选项:
	-i: 忽略大小写
	-c: 统计重复行次数
	-d:只显示重复行

5.tee

tee命令用于读取标准输入的数据,并将其内容输出成文件。即:双向覆盖重定向(屏幕输出|文本输入)

选项:
	-a 双向追加重定向

6.diff

diff工具用于逐行比较文件的不同

常见选项
	-b不检查空格
	-B不检查空白行
	-i不检查大小写
	-w忽略所有的空格
	--normal正常格式显示(默认)
	-c上下文格式显示
	-u合并格式显示

7.paste

paste工具用于合并文件行

常用选项:
-d:自定义间隔符,默认是tab
-s:串行处理,非并行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值