linux对字符串进行筛选,Linux | 文本筛选工具:grep的常规用法

29eec46798822605ca9a5ddf699cf6c0.png

grep是在终端下,从文件中筛选文本最常用的工具.估计大多数人停留在cat file|grep xxx或者grep xxx file的阶段.其实这是个超级强大的工具,今天就进行简单的初探.

操作对象:『The Zen Of Python』

$ python -c 'import this' |tee a.txt

The Zen of Python, by Tim Peters

Beautiful is better than ugly.

Explicit is better than implicit.

Simple is better than complex.

Complex is better than complicated.

Flat is better than nested.

Sparse is better than dense.

Readability counts.

Special cases aren't special enough to break the rules.

Although practicality beats purity.

Errors should never pass silently.

Unless explicitly silenced.

In the face of ambiguity, refuse the temptation to guess.

There should be one-- and preferably only one --obvious way to do it.

Although that way may not be obvious at first unless you're Dutch.

Now is better than never.

Although never is often better than *right* now.

If the implementation is hard to explain, it's a bad idea.

If the implementation is easy to explain, it may be a good idea.

Namespaces are one honking great idea -- let's do more of those!

其它基本用法

-c count出现次数

-n number显示行

-v 排除

-i 忽略大小写

友情提示,以下演示在有颜色的终端下,效果更佳

匹配后输出前后行

后面(After)一行 -A 1

$ grep 'Unless explicitly' -nA 1 a.txt

13:Unless explicitly silenced.

14-In the face of ambiguity, refuse the temptation to guess.

前面(Before)一行 -B 1

grep 'Unless explicitly' -nB 1 a.txt

12-Errors should never pass silently.

13:Unless explicitly silenced.

前后各一行 -1 或 -C 1

$ grep 'Unless explicitly' -n1 a.txt

12-Errors should never pass silently.

13:Unless explicitly silenced.

14-In the face of ambiguity, refuse the temptation to guess.

$ grep 'Unless explicitly' -nC 1 a.txt

12-Errors should never pass silently.

13:Unless explicitly silenced.

14-In the face of ambiguity, refuse the temptation to guess.

匹配后输出前后几个字符

查找的字符串为Python

前三个字符

$ grep -o -P '.{0,3}Python' a.txt

of Python

后五个字符

$ grep -o -P 'Python.{0,5}' a.txt

Python, by

前三后五个字符

$ grep -o -P '.{0,3}Python.{0,5}' a.txt

of Python, by

文件匹配

排除a.txt里存在的内容

$ grep -vf b.txt a.txt

高亮匹配项

检查nginx是否包含模块

$ nginx -V 2>&1 | grep -o with-http_stub_status_module

with-http_stub_status_module

相关博文

使用说明 : 1、本程序可以作什么? 本程序功能分为两个部分: 一部分是:批量查找指定路径下的文件中的内容中,是否包含要查询的项目。并把查询出的内容分文件存储。 一部分是:将文本文件导入EXCEL中,可以将上一步查找的结果导入,也可以自己选择文件导入(支持多选)。 2、如何使用他? a、批量查找: 首先,在“读入位置”按钮处设置你所要读取的文件的存放位置,此时程序会自动读入此文件夹下所有文件,以供选择;其次,用“>>”或“>”将要读取的文件选入读取队列,当然如果选错了可以用“<<”或“<”删除队列,或者鼠标双击选中项删除;再次,点击“+”按钮,添加查找项目到查找项目列表,一次只可以添加一条,如需添加多条则需要重复添加操作;如果添加错误可以双击选中项删除或选中后点击“-”按钮。最后,点击“开始查找”,程序将会把查找结果输出保存到指定路径下面的output文件夹下面,你可以选择是否打开目录查看。如果需要查询的文件有文件头,可以选择“保留文件首行”。 b、EXCEL导入: 首先,选择导入方式,导入方式分为“查询结果导入”和“新选文件导入”两种;当选择“查询结果导入”时,本程序将把“读入位置”处“output”文件夹下文件批量导入EXCEL。当选择“新选文件导入”时,本程序在点击“开始导入”时将弹出窗口,您可以自己选择需要导入文件(支持多选),导入EXCEL。其次,设置导入文件时的分割符,默认为“|”,本程序只支持按照分隔符导入。最后,点击“开始导入”按钮开始导入。 3、本程序不判断所查找的文件类型 由于本程序在读入文件时,并没有校验文件的内容和文件类型,因此本程序会读取用户所选择的任意文件,即使此文件是二进制格式的。不论是查询或者是导入功能都是这样。本程序将按行读取所选择的文件(或者有换行符的),在读取完文件后,无论是否找到,都会创建和源文件相同类型的文件,即使是.exe或.rar(一般是打不开的),文件名存储为“output”+原文件名。即使没有找到任何相匹配的内容,本程序也会创建文件,这时后文件大小是0字节,可以按照大小排列看到。 4、请使用“清除文件”按钮及时清除查询结果 程序在查询和创建文件的过程中,不会判断是否已经执行过查询操作。如果已经执行过查询操作,“output”文件夹下就会存在查询出的文件,当再次执行查询时,本程序会在已存在的文件后追加查询结果。这样就会出现重复的记录或内容。因此,当需要多次查询时,每次查询前需要点击“清空文件”按钮删除output文件夹,才能保证查找的准确。 5、本程序不会判断运行的环境,因此在运行过程中可能会有些未知的错误 本程序在win7环境,vs2012,Netframe4.0下编译通过。本程序支持winxp及以上操作系统。执行EXCEL导入的时候,需要安装Office。Office的版本在2003以上就可以。但是不同我Office版本对导入性能,有一定的影响。Excel2003,最多256列,即2的8次方,最多65536行,即2放入16次方; Excel2007及以上版本,最多16384列,即2的14次方,最多1048576行,即2的20次方。因此如果需要导入的单个文件的行数或者列数,超过了所安装Office版本的最多行列数,程序将会报错!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值