grep与正则表达式

转载 2015年07月07日 14:18:44

     正则表达式只是字符串的一种描述,只有和支持正则表达式的工具相结合才能进行字符串处理。本文以grep为例来讲解正则表达式。

grep命令

功能:输入文件的每一行中查找字符串。

基本用法:

grep [-acinv] [--color=auto] [-A n] [-B n] '搜寻字符串' 文件名
参数说明:
-a:将二进制文档以文本方式处理
-c:显示匹配次数
-i:忽略大小写差异
-n:在行首显示行号
-A:After的意思,显示匹配字符串后n行的数据
-B:before的意思,显示匹配字符串前n行的数据
-v:显示没有匹配行-A:After的意思,显示匹配部分之后n行-B:before的意思,显示匹配部分之前n行
--color:以特定颜色高亮显示匹配关键字

     –color选项是个非常好的选项,可以让你清楚的明白匹配了那些字符。最好在自己的.bashrc或者.bash_profile文件中加入:

alias grep=grep --color=auto

     每次grep搜索之后,自动高亮匹配效果了。

     ‘搜寻字符串’是正则表达式,注意为了避免shell的元字符对正则表达式的影响,请用单引号(’’)括起来,千万不要用双引号括起来("”)或者不括起来。

     正则表达式分为基本正则表达式和扩展正则表达式。下面分别简单总结一下。

基本正则表达式

     正则表达式学习,主要是对正则表达式元数据的学习。正则表达式本身没有什么高深的东西,本文仅仅对基本正则表达式的元数据进行一下总结:

元数据

意义和范例

^word 搜寻以word开头的行。

例如:搜寻以#开头的脚本注释行

grep –n ‘^#’ regular.txt

word$ 搜寻以word结束的行

例如,搜寻以‘.’结束的行

grep –n ‘.$’ regular.txt

. 匹配任意一个字符。

例如:grep –n ‘e.e’ regular.txt

匹配e和e之间有任意一个字符,可以匹配eee,eae,eve,但是不匹配ee。

\ 转义字符。

例如:搜寻’,’是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。

grep –n ‘\” regular.txt

* 前面的字符重复0到多次。

例如匹配gle,gogle,google,gooogle等等

grep –n ‘go*gle’ regular.txt

[list] 匹配一系列字符中的一个。

例如:匹配gl,gf。

grep –n ‘g[lf]’ regular.txt

[n1-n2] 匹配一个字符范围中的一个字符。

例如:匹配数字字符

grep –n ‘[0-9]’ regular.txt

[^list] 匹配字符集以外的字符

例如:grep –n ‘[^o]‘ regular.txt

匹配非o字符

\{n1,n2\} 前面的字符重复n1,n2次

例如:匹配google,gooogle。

grep –n ‘go\{2,3\}gle’ regular.txt

\<word 单词是的开头。

例如:匹配以g开头的单词

grep –n ‘\<g’ regular.txt

word\> 匹配单词结尾

例如:匹配以tion结尾的单词

grep –n ‘tion\>’ regular.txt

扩展正则表达式

     grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。

     扩展正则表达式就是在基本正则表达式的基础上,增加了一些元数据。

元数据

意义和范例

+ 重复前面字符1到多次。

例如:匹配god,good,goood等等字符串。

grep –nE go+d’ regular.txt

? 匹配0或1次前面的字符

例如,匹配gd,god

grep –nE ‘go?d’ regular.txt

| 或(or)的方式匹配多个字串  
例如:grep –nE ‘god|good’ regular.txt

匹配god或者good。

() 匹配整个括号内的字符串,原来都是匹配单个字符

例如:搜寻good或者glad

grep –nE ‘g(oo|la)’ regular.txt

() 前面的字符重复0到多次。

例如匹配gle,gogle,google,gooogle等等

grep –nE ‘go*gle’ regular.txt

     Linux下面正则表达式博大精深,上文支持总结了最常用的部分,如果熟练掌握的上面部分的正则表达式基本上可以满足日常使用了。

     另外Linux很多命令支持正则表达式,比如find,sed,awk等等。请在使用的时候参照这些命令的手册使用正则表达式。

grep命令+正则表达式

grep命令:通用正则表达式解析器 的简称 grep命令使用一个选项,一个要匹配的模式,要搜索的文件。 语法:grep [options] PATTERN [FILES] 如果没有提供文件名,则gr...
  • Tanswer_
  • Tanswer_
  • 2016年06月15日 15:15
  • 1598

Linux grep基本用法与正则表达式

本文只是对于常用的grep配合正则表达式基本用法进行简单小结,如果想仔细的学习正则表达式,请访问鸟哥Linux私房菜,台湾同胞的网站是繁体中文的,需要点儿耐心。1、grep命令功能:输入文件的每一行中...
  • xy010902100449
  • xy010902100449
  • 2016年05月16日 16:50
  • 1872

grep 基本正则表达式

文本搜索工具:grep, egrep, fgrep  Linux上文本处理三剑客 grep, egrep, fgrep:文本搜索工具;基于”pattern“-(模式)对给定文本进行搜索操作...
  • zhangchenglikecc
  • zhangchenglikecc
  • 2016年08月11日 13:14
  • 543

linux 下利用ls grep 和正则表达式实现目录和文件的分开显示

b9.html   要列出当前目录下所有的文件名和目录名直接使用ls命令即可。 但如何只列出文件名而不列出目录呢? 查遍了ls 的帮助,也没看到有这个现成的选项。 幸好这个问题还是比较常见...
  • haiyanglideshi
  • haiyanglideshi
  • 2015年10月10日 13:53
  • 6010

grep用法详解:grep与正则表达式

grep用法详解:grep与正则表达式 首先要记住的是: 正则表达式与通配符不一样,它们表示的含义并不相同! 正则表达式只是一种表示法,只要工具支持这种表示法,那么该工具就可以处理正则表达式的字符...
  • hellochenlian
  • hellochenlian
  • 2014年06月24日 11:27
  • 34208

正则表达式(grep,egrep,fgrep)

1.正则表达式概述 正则表达式又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机...
  • dyllove98
  • dyllove98
  • 2014年11月19日 17:15
  • 6668

Linux---文本处理(正则表达式,grep,awk,sed)

文本处理(一) 本文主要讲述正则表达式,grep,awk,sed命令。 3个命令都是针对行进行处理的。 grep: 主要用来进行字符串在文件中的搜索。        示例: grep ...
  • wei_ge163
  • wei_ge163
  • 2013年06月09日 13:14
  • 6068

第七章、grep及正则表达式

第七章、grep及正则表达式04_04_grep及正则表达式 grep家族: grep, egrep, fgrep   grep: 根据模式搜索文本,并将符合模式的文本行显示出来。Pattern: 文...
  • Toormi
  • Toormi
  • 2015年08月13日 16:47
  • 926

Linux大神养成之正则表达式(grep,sed)

Linux大神养成之正则表达式grep命令参数: -A后面加数字,代表after,表示把该行的后续n行也列出来 -B后面加数字,代表befer,表示把改行的前面n行也列出来 $ dmesg | gre...
  • y990041769
  • y990041769
  • 2015年07月31日 10:58
  • 6468

grep、sed、awk、perl等对正则表达式的支持的差别

在各种常用的工具中, 正则表达式如此的相似却又不同。 下表列出了一些常用的正则表达式,以及其不同之处。 项目总多,遗漏必有不少,请各位看官不吝指出。 以perl的正则为基准,不同的用法以粉红色...
  • zouxue138
  • zouxue138
  • 2013年02月28日 10:23
  • 1027
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:grep与正则表达式
举报原因:
原因补充:

(最多只允许输入30个字)