Linux中grep命令,用或的关系查询多个字符串,正则表达式基础说明

原创 2016年10月19日 18:52:51
使用 grep 'word1|word2' 文件名  这样的命令是不对的!


应该使用如下的命令:

1,grep -E 'word1|word2' 文件名

2,egrep 'word1|word2' 文件名

3,grep 'word1/|word2' 文件名


为什么需要加-E,关于grep 和 egrep:


egrep 等同于 grep -E 。它会以扩展的正则表达式的模式来解释模式。下面来自 grep 的帮助页:
基本的正则表达式元字符 ?、+、 {、 |、 ( 和 ) 已经失去了它们原来的意义,要使用的话用反斜线的版本 /?、/+、/{、/|、/( 和 /) 来代替。 传统的 egrep 并不支持 { 元字符,一些 egrep 的实现是以 /{ 替代的,所以一个可移植的脚本应该避免在 grep -E 使用 { 符号,要匹配字面的 { 应该使用 [}]。
GNU grep -E 试图支持传统的用法,如果 { 出在在无效的间隔规范字符串这前,它就会假定 { 不是特殊字符。
例如,grep -E ‘{1′ 命令搜索包含 {1 两个字符的串,而不会报出正则表达式语法错误。

POSIX.2 标准允许这种操作的扩展,但在可移植脚本文件里应该避免这样使用。


关于正则表达式的基本分类:

1、基本的正则表达式(Basic Regular Expression 又叫 Basic RegEx 简称 BREs) 
2、扩展的正则表达式(Extended Regular Expression 又叫 Extended RegEx 简称 EREs) 
3、Perl 的正则表达式(Perl Regular Expression 又叫 Perl RegEx 简称 PREs) 

关于基本正则表达式和扩展正则表达式的一些用法:

基本正则表达式

元数据

意义和范例

^word

搜寻以word开头的行。

例如:搜寻以#开头的脚本注释行

grep –n ‘^#’ regular.txt

word$

搜寻以word结束的行

例如,搜寻以‘.’结束的行

grep –n ‘.$’ regular.txt

.

匹配任意一个字符。

例如:grep –n ‘e.e’ regular.txt

匹配ee之间有任意一个字符,可以匹配eeeeaeeve,但是不匹配ee

\

转义字符。

例如:搜寻是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。

grep –n ‘\” regular.txt

*

前面的字符重复0到多次。

例如匹配glegoglegooglegooogle等等

grep –n ‘go*gle’ regular.txt

[list]

匹配一系列字符中的一个。

例如:匹配glgf

grep –n ‘g[lf]’ regular.txt

[n1-n2]

匹配一个字符范围中的一个字符。

例如:匹配数字字符

grep –n ‘[0-9]’ regular.txt

[^list]

匹配字符集以外的字符

例如:grep –n ‘[^o]‘ regular.txt

匹配非o字符

\{n1,n2\}

前面的字符重复n1n2

例如:匹配googlegooogle

grep –n ‘go\{2,3\}gle’ regular.txt

\<word

单词是的开头。

例如:匹配以g开头的单词

grep –n ‘\<g’ regular.txt

word\>

匹配单词结尾

例如:匹配以tion结尾的单词

grep –n ‘tion\>’ regular.txt


扩展正则表达式

     grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。

     扩展正则表达式就是在基本正则表达式的基础上,增加了一些元数据。

元数据

意义和范例

+

重复前面字符1到多次。

例如:匹配godgoodgoood等等字符串。

grep –nE go+d’ regular.txt

?

匹配01次前面的字符

例如,匹配gdgod

grep –nE ‘go?d’ regular.txt

|

或(or)的方式匹配多个字串  
例如:grep –nE ‘god|good’ regular.txt

匹配god或者good

()

匹配整个括号内的字符串,原来都是匹配单个字符

例如:搜寻good或者glad

grep –nE ‘g(oo|la)’ regular.txt

()

前面的字符重复0到多次。

例如匹配glegoglegooglegooogle等等

grep –nE ‘go*gle’ regular.txt

 


版权声明:本文为博主瞎抄的文章,未经博主允许可以随意转载。 https://blog.csdn.net/lkforce/article/details/52862193

使用grep搜索多个单词或字串

语法 grep ‘pattern*’ file1 file2 egrep ‘pattern1|pattern2’ *.py grep -e pattern1 -e pattern2 *.pl 一些别的...
  • kangkanglou
  • kangkanglou
  • 2017-06-23 20:57:22
  • 3049

grep多个关键字“与”和“或”

1、或操作   grep -E '123|abc' filename  // 找出文件(filename)中包含123或者包含abc的行   egrep '123|abc' filename   ...
  • yucan1001
  • yucan1001
  • 2013-01-22 21:07:16
  • 23956

grep -E 即 egrep 匹配多个

grep --help -E, --extended-regexp     PATTERN 是一个可扩展的正则表达式(缩写为 ERE) ‘egrep’即‘grep -E’。 匹配单个,...
  • devwang_com
  • devwang_com
  • 2016-09-08 11:49:03
  • 15204

grep 查询多个字符串

grep 同时满足多个关键字和满足任意关键字 ① grep -E "word1|word2|word3"   file.txt    满足任意条件(word1、word2和word3之一)将匹...
  • chimei2345
  • chimei2345
  • 2014-05-15 14:39:55
  • 1708

怎样用grep匹配多个字符串? grep -E 'aaaaa|bbbbbb'

怎样用grep匹配多个字符串? grep -E   'aaaaa|bbbbbb'
  • lixingying567
  • lixingying567
  • 2017-07-07 15:27:54
  • 1351

grep-查找符合条件的字符串

grep:         查找行里符合条件的字符串 grep退出状态:     0: 表示成功;     1: 表示在所提供的文件无法找到匹配的pattern;     2: 表示...
  • u011748522
  • u011748522
  • 2014-09-17 15:45:03
  • 3347

linux shell 字符串操作(长度,查找,替换,匹配)详解

linux shell 字符串操作(长度,查找,替换,匹配)详解 在做shell批处理程序时候,经常会涉及到字符串相关操作。有很多命令语句,如:awk...
  • bingyu9875
  • bingyu9875
  • 2017-01-13 10:18:51
  • 1023

Linux shell 字符串匹配

最近进行脚本学习的时候,遇到了字符串匹配的问题,网上的内容也很乱,在这里我就写一个简单可行的方法吧。        首先假设一个场景:在一个文件夹里有很多后缀为sh的文件,那我怎么移动除了指定的某些...
  • li6727975
  • li6727975
  • 2015-01-02 13:32:46
  • 3741

Linux Shell 在整个工程中查找字符串或匹配模式

在阅读代码,尤其是较为复杂的工程时,我经常需要在整个工程下查找某个变量、类或函数。从而明确他们何时被赋值、读取,与其他类有什么关系以及何时被调用等。这样,便于我们理解工程的结构、程序执行的流程。我们可...
  • hollokitty
  • hollokitty
  • 2016-03-04 16:15:57
  • 506

linux命令(查找文件/字符串匹配)

查找文件  find  -name '*record*' ===================================================================...
  • kipochen
  • kipochen
  • 2012-06-28 15:34:15
  • 17305
收藏助手
不良信息举报
您举报文章:Linux中grep命令,用或的关系查询多个字符串,正则表达式基础说明
举报原因:
原因补充:

(最多只允许输入30个字)