【技术分享】系统理解正则表达式--------3个括号1个问号

be5yond

已于 2024-03-06 14:38:26 修改

阅读量537

点赞数 1

文章标签：正则表达式 regex

于 2021-06-09 11:12:42 首次发布

本文链接：https://blog.csdn.net/be5yond/article/details/117733988

版权

什么是正则表达式？

一种从左到右匹配主体字符串的模式。 “Regular expression ---> regex或regexp”。
正则表达式可以从一个基础字符串中根据一定的匹配模式替换文本中的字符串、验证表单、提取字符串等等。例：

正则表达式其实就是在执行搜索时的格式，它由一些字母和数字组合而成。
正则表达式123匹配字符串123。它逐个字符的与输入的正则表达式做比较。正则表达式是大小写敏感的，所以The不会匹配the。

"the" => The fat cat sat on the mat.

如果需要匹配多种可能的字符，使用字符集[]。
如[Tt]表示该字符可以是t或者T中的一个

"[Tt]he" => The car parked in the garage.

如[0-9]表示该字符可以是0,1,2,3,4,5,6,7,8,9中的一个

"[0-9] meters" => The frog climbs 3 meters during the day and retreats 2 meters at night.

正则表达式提供一些常用的字符集简写。如下

简写	描述	[a-zA-Z_]	[0-9]	[!&#@等]	空格	\f	\n	\r	\t	\v
.	除换行符外的所有字符	✅	✅	✅	✅	✅	✅	❌	✅	✅
\w	匹配所有字母数字，等同于 `[a-zA-Z0-9_]`	✅	✅	❌	❌	❌	❌	❌	❌	❌
\W	匹配所有非字母数字，即符号，等同于： `[^\w]`	❌	❌	✅	✅	✅	✅	✅	✅	✅
\d	匹配数字： `[0-9]`	❌	✅	❌	❌	❌	❌	❌	❌	❌
\D	匹配非数字： `[^\d]`	✅	❌	✅	✅	✅	✅	✅	✅	✅
\s	匹配所有空格字符，等同于： `[\t\n\f\r\p{Z}]`	❌	❌	❌	✅	✅	✅	✅	✅	✅
\S	匹配所有非空格字符： `[^\s]`	✅	✅	✅	❌	❌	❌	❌	❌	❌
\f	匹配一个换页符	❌	❌	❌	❌	✅	❌	❌	❌	❌
\n	匹配一个换行符	❌	❌	❌	❌	❌	✅	❌	❌	❌
\r	匹配一个回车符	❌	❌	❌	❌	❌	❌	✅	❌	❌
\t	匹配一个制表符	❌	❌	❌	❌	❌	❌	❌	✅	❌
\v	匹配一个垂直制表符	❌	❌	❌	❌	❌	❌	❌	❌	✅
\p	匹配 CR/LF（等同于 `\r\n`），用来匹配 DOS 行终止符	❌	❌	❌	❌	❌	✅	✅	❌	❌