正则表达式

最新推荐文章于 2022-01-12 09:30:59 发布

TLpigff

最新推荐文章于 2022-01-12 09:30:59 发布

阅读量247

点赞数

分类专栏： Linux c++ 文章标签：正则表达式

本文链接：https://blog.csdn.net/lvyibin890/article/details/81069071

版权

32 篇文章 11 订阅

订阅专栏

21 篇文章 3 订阅

订阅专栏

正则表达式目的（最初是由Linux的sed和grep发展而来）

目的

下面用grep命令用来验证正则表达式，grep是Linux下一个按行匹配文本的工具

.bashrc中加grep重命名了，如下，所以默认会显示匹配高亮

alias grep='grep --color=auto'

alias fgrep='fgrep --color=auto'

alias egrep='egrep --color=auto'

egrep等价于grep -E，它用的扩展正则匹配

基本要素

字符类

字符	含义	举例
.	匹配任意一个字符	abc.可以匹配abcd,abce等
[]	匹配括号中的任何一个字符	[abc]d可以匹配ad，bd，cd三种情况
-	在[]内表示字符的范围	[0-9a-fA-F]可以匹配一位十六进制数字
^	位于[]括号内的开头，匹配除括号中的字符之外的任何一个字符,表示非	[^xy]1可以匹配a1,b1,但不匹配x1,y1
[[ :xxx: ]]	grep工具预定义的一些命名字符类，注意只匹配一个	[[ :alpha: ]]匹配一个字母 [[ :digit: ]]匹配一个数字

举例

注：[]中的内容都只匹配一个字符

数量限定符

举例

位置限定符

字符	含义	举例
^（在匹配内容的前面）	匹配行首的位置	^Content匹配位于一行开头的Content
$（在匹配内容的后面）	匹配行末的位置	;$匹配位于一行结尾的;，^$匹配空行
\<（在匹配内容的前面）	匹配单词开头的位置	\<th 匹配th开头的单词，比如this
\>（在匹配内容的后面）	匹配单词结尾的位置	p\> 匹配p结尾的单词，比如leap
\b	匹配单词开头或结尾的位置	\bat\b匹配a开头t结尾的单词，比如at
\B	匹配非单词开头和结尾的位置	\Bat\B匹配不是a开头且不是t结尾的单词，比如battery

举例

说明：其中\b用来限定是目标串中是否有以指定字符串开头的单词，称之为词界，\B称之为非词界

特殊符号

字符	含义	举例
\	转义字符，普通字符转义为特殊字符，特殊字符转义为普通字符	普通字符<写成\<表示单词开头位置，特殊字符.写成\.以及特殊字符\写成\\就是普通字符
()	将正则表达式的一部分括起来组成一个单元（前面的数量限定符都是以单元为单位的，而不是字符）	([0-9]{1,3}\.){3}[0-9]{1,3}表示IP地址
\|	连接两个子表达式，表示或的关系	n(o\|either)匹配no或neither

举例

正则表达式的分类

基本和扩展正则表达式两者的区别就是对一些特殊字符的解释不同（ ?+{}|() ）。

举例

以下是一些常见\转义的字符集