程序基础：正则表达式

最新推荐文章于 2023-01-10 12:21:22 发布

|静水流深|

最新推荐文章于 2023-01-10 12:21:22 发布

阅读量803

点赞数

分类专栏：程序员基础 # Linux 文章标签：正则表达式

本文链接：https://blog.csdn.net/baidu_35260565/article/details/128391511

版权

程序员基础同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

Linux

3 篇文章 0 订阅

订阅专栏

一、正则表达式元字符

1.匹配字符：

. ：任意一个字符。
[abc] ：表示匹配一个字符，这个字符必须是abc中的一个。
[a-zA-Z]：表示匹配一个字符，这个字符必须是a-z或A-Z这52个字母中的一个。
[^123] ：匹配一个字符，这个字符是除了1、2、3以外的所有字符。
对于一些常用的字符集，系统做了定义：
[A-Za-z] 等价于 [[:alpha:]]
[0-9] 等价于 [[:digit:]]
[A-Za-z0-9] 等价于 [[:alnum:]]
tab,space 等空白字符 [[:space:]]
[A-Z] 等价于 [[:upper:]]
[a-z] 等价于 [[:lower:]]
标点符号 [[:punct:]]

2.匹配次数：

\ {m,n\ } ：匹配其前面出现的字符至少m次，至多n次。
\ ? ：匹配其前面出现的内容0次或1次，等价于\ {0,1\ }。
* ：匹配其前面出现的内容任意次，等价于\ {0,\ }，所以 “.*” 表述任意字符任意次，即无论什么内容全部匹配。

3.位置锚定：

^ ：锚定行首
$ ：锚定行尾。技巧：“^$“用于匹配空白行。
\b或\<：锚定单词的词首。如”\blike"不会匹配alike，但是会匹配liker
\b或\>：锚定单词的词尾。如”\blike\b"不会匹配alike和liker，只会匹配like
\B ：与\b作用相反。匹配不以xxx 开头或结尾的

4.分组及引用：

$string$ ：将string作为一个整体方便后面引用
\1 ：引用第1个左括号及其对应的右括号所匹配的内容。
\2：引用第2个左括号及其对应的右括号所匹配的内容。
\n ：引用第n个左括号及其对应的右括号所匹配的内容。

二、扩展的（Extend）正则表达式

匹配字符：这部分和基本正则表达式一样

匹配次数：

* ：和基本正则表达式一样 ? ：基本正则表达式是?，二这里没有\。
{m,n} ：相比基本正则表达式也是没有了\。
+：匹配其前面的字符至少一次，相当于{1,}。

位置锚定：和基本正则表达式一样。

分组及引用：

(string) ：相比基本正则表达式也是没有了\。
\1 ：引用部分和基本正则表达式一样。
\n ：引用部分和基本正则表达式一样。

或者：

a|b ：匹配a或b，注意a是指 | 的左边的整体，b也同理。比如 C|cat 表示的是
C或cat，而不是Cat或cat，如果要表示Cat或cat，则应该写为 (C|c)at 。记住(string)除了用于引用还用于分组。

注1：默认情况下，正则表达式的匹配工作在贪婪模式下，也就是说它会尽可能长地去匹配，比如某一行有字符串 abacb，如果搜索内容为 “a.*b” 那么会直接匹配 abacb这个串，而不会只匹配ab或acb。
注2：所有的正则字符，如 [ 、* 、( 等，若要搜索 * ，而不是想把 * 解释为重复先前字符任意次，可以使用\* 来转义。