10分钟看懂正则表达式

Jack_chao_

于 2023-02-07 15:07:04 发布

阅读量479

点赞数

分类专栏：安全文章标签：正则表达式 unix 服务器 Powered by 金山文档

本文链接：https://blog.csdn.net/Jack_chao_/article/details/128579161

版权

安全专栏收录该内容

23 篇文章 0 订阅

订阅专栏

正则表达式简介

正则表达式是由一些具有特殊含义的字符组成的字符串，多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。

一、元字符

元字符：即为有特定含义的字符，常见的元字符如下

常用的元字符

代码	说明
.	匹配除换行符以外的任意单个字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始（在集合字符里[^a]表示非（不匹配）的意思
$	匹配字符串的结束

详解和示例：

（1）. 匹配任何任意字符例如 . 可以匹配 1，n，*，+，- ,等

（2）\d\w\s 匹配第一个字符为数字，第二个字符为字母或数字、或下划线或汉字，第三字符为空格的字符串例如：11 ，2a , 1_

（3）^\d\d\d$ 匹配三个全部都为数字的字符串例如： 123,456,789

还可以用于验证输入的字符串是否符合qq（身份证号）的验证：

例如：^\d{8}$ 匹配8位数字的qq号，^\d{15}&匹配15位均为数字的身份证号

（4）\bOlive\b 匹配单词Olive 例如： I Love Oliver and Olive .这个时候返回的是Olive 而不是Oliver,因为\b....\b返回的匹配的单词

二、反义字符

反义字符：多用于查找除某个字符以外其他任意字符均可以的情况

常用的反义字符如下：

常用的反义字符

代码/语法	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

详解和示例：

（1）\W 匹配除字母、数字、下划线、汉字以为的字符形如 +，-，*

（2）\S 匹配除空格以外的任意字符形如：1，* ，）

（3）[^abcde]匹配除abcde以为的其他字符如 e，f，g，h

三、限定字符

限定字符多用于重复匹配次数

常用的限定字符如下：

常用的限定符

代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{,m}	重复n次或更多次
{n,m}	重复n到m次

详解和示例：

（1）\d* 匹配重复0次或多次数字例如:可能为空或任意数字（2,3。。。。）

（2）\d+ 匹配重复1次或多次数字例如:可能为1个或多个数字 1,23,234,2345，........

（3）\d? 匹配重复次个或者一次数字例如：可能为空或者任意的一个数字（1,2，。。。）

（4）\d{8}匹配重复8次数字例如：123456768

（5）\d{4,}匹配重复至少4次数字例如：1234,12345,124244,。。。。。

（6）^\d{8,11}$ 匹配重复8-11次数字例如：12345678,123456789,1234567890,12345678901

四、懒惰匹配和贪婪匹配

贪婪匹配：正则表达式中包含重复的限定符时，通常的行为是匹配尽可能多的字符。

懒惰匹配，有时候需要匹配尽可能少的字符。

例如： a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。但是我们此时可能需要匹配的是ab这样的话就需要用到懒惰匹配了。懒惰匹配会匹配尽可能少的字符

常用的懒惰匹配限定符如下：

懒惰限定符

代码/语法	说明
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复