正则表达式Regular expression

最新推荐文章于 2024-01-10 15:39:46 发布

Xh1Xxhg

最新推荐文章于 2024-01-10 15:39:46 发布

阅读量103

点赞数

文章标签：正则表达式 php 开发语言

本文链接：https://blog.csdn.net/weixin_64667536/article/details/129192220

版权

正则表达式Regular expression

正则表达式可以从一个基础字符串中根据一定的匹配模式替换文本中的字符串、验证表单、提取字符串等等。

1.基本匹配

“the” => The fat cat sat on the mat.

2.元字符

元字符不代表他们本身的字面意思，他们都有特殊的含义。

一些元字符写在方括号中的时候有一些特殊的意思。

元字符	描述
.	句号匹配任意单个字符除了换行符。
[ ]	字符种类。匹配方括号内的任意字符。
[^ ]	否定的字符种类。匹配除了方括号里的任意字符
*	匹配>=0个重复的在*号之前的字符。
+	匹配>=1个重复的+号前的字符。
?	标记?之前的字符为可选.
{n,m}	匹配num个大括号之前的字符或字符集 (n <= num <= m).
(xyz)	字符集，匹配与 xyz 完全相等的字符串.
\|	或运算符，匹配符号前或后的字符.
\	转义字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \
^	从开始行开始匹配.
$	从末端开始匹配.

点运算符 .

.匹配任意单个字符，但不匹配换行符。

相当于可以代替一个字符

字符集

字符集也叫做字符类。方括号用来指定一个字符集。

在方括号中使用连字符来指定字符集的范围

“[ Tt ] he” => The car parked in the garage.

否定字符集

^用在一个方括号的开头的时候，它表示这个字符集是否定的

“[ ^ c ] ar” => The car parked in the garage.

重复次数

跟着元字符 +，* ， ? 的，用来指定匹配子模式的次数。

* 号

*号匹配在 *之前的字符出现大于等于0次

0次：可以不用出现

.*任意字符出现>=0次

"[a-z]*" => The car parked in the garage #21.//匹配小写字母开头的字符串

+ 号

+号匹配+号之前的字符出现 >=1 次

1次：至少出现一次

.+任意字符出现>=1次

? 号

可选匹配

表达式 [T]?he 匹配字符串 he 和 The

慵懒匹配

c.+?t——只匹配较少字符的字符串

The fat cat sat on the mat.

{} 号

限定一个或一组字符可以重复出现的次数。

[0-9]{2,3} 匹配最少 2 位最多 3 位 0~9 的数字。

[0-9]{2,} 匹配至少两位 0~9 的数字。

[0-9]{3} 匹配3位数字

`(...)` 特征标群

(...) 中包含的内容将会被看成一个整体

（ab)*匹配连续出现 0 或更多个ab
在 {} 前加上特征标群 (...) 则表示整个标群内的字符重复 N 次。
或：

“(c|g|p)ar” => The car is parked in the garage.

| 或运算符

“(T|t)he|car” => The car is parked in the garage

转码特殊字符

反斜线 \ 在表达式中用于转码紧跟其后的字符。

用于指定 { } [ ] / \ + * . $ ^ | ? 这些特殊字符

选择性匹配：

“(f|c|m)at.?” => The fat cat sat on the mat.

锚点

匹配指定开头或结尾的字符串就要使用到锚点。^ 指定开头，$ 指定结尾。

^ 号

^ 用来检查匹配的字符串是否在所匹配字符串的开头。

“^(T|t)he” => The car is parked in the garage.

$ 号

$ 号用来匹配字符是否是最后一个。

“(at.)$” => The fat cat. sat. on the mat.

3.简写字符集

简写	描述
.	除换行符外的所有字符
\w	匹配所有字母数字，等同于 `[a-zA-Z0-9_]`
\W	匹配所有非字母数字，即符号，等同于： `[^\w]`
\d	匹配数字： `[0-9]`
\D	匹配非数字： `[^\d]`
\s	匹配所有空格字符，等同于： `[\t\n\f\r\p{Z}]`
\S	匹配所有非空格字符： `[^\s]`
\f	匹配一个换页符
\n	匹配一个换行符
\r	匹配一个回车符
\t	匹配一个制表符
\v	匹配一个垂直制表符
\p	匹配 CR/LF（等同于 `\r\n`），用来匹配 DOS 行终止符