GitHub标星4.1w，超火的正则表达式学习教程，速速收藏~

最新推荐文章于 2024-01-22 20:12:15 发布

觉皇嵌入式

最新推荐文章于 2024-01-22 20:12:15 发布

阅读量979

点赞数

分类专栏： C/C++ 文章标签：正则表达式 github 学习

原文链接：https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md

版权

C/C++ 专栏收录该内容

25 篇文章 5 订阅

订阅专栏

GitHub标星4.1w，超火的正则表达式学习教程，速速收藏~

GitHub上有一个非常牛X的项目：learn-regex，目前已经41.7K 星。教程简单易懂、明确，并且还有在线练习，可以有效的帮助各位小伙伴掌握正则表达式的使用，且这个项目被翻译成了多种语言。以下网址为中文说明readme：

https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md

有的小伙伴上github比较慢甚至进不去，遂搬运至此。

什么是正则表达式？

正则表达式是一组由字母和符号组成的特殊文本，它可以用来从文本中找出满足你想要的格式的句子。

一个正则表达式是一种从左到右匹配主体字符串的模式。

“Regular expression”这个词比较拗口，我们常使用缩写的术语“regex”或“regexp”。

正则表达式可以从一个基础字符串中根据一定的匹配模式替换文本中的字符串、验证表单、提取字符串等等。

想象你正在写一个应用，然后你想设定一个用户命名的规则，让用户名包含字符、数字、下划线和连字符，以及限制字符的个数，好让名字看起来没那么丑。

我们使用以下正则表达式来验证一个用户名：

以上的正则表达式可以接受 john_doe、jo-hn_doe、john12_as。
但不匹配Jo，因为它包含了大写的字母而且太短了。

元字符	描述
.	句号匹配任意单个字符除了换行符。
[ ]	字符种类。匹配方括号内的任意字符。
[^ ]	否定的字符种类。匹配除了方括号里的任意字符
*	匹配>=0个重复的在*号之前的字符。
+	匹配>=1个重复的+号前的字符。
?	标记?之前的字符为可选.
{n,m}	匹配num个大括号之前的字符或字符集 (n <= num <= m).
(xyz)	字符集，匹配与 xyz 完全相等的字符串.
\|	或运算符，匹配符号前或后的字符.
\	转义字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \ \|`
^	从开始行开始匹配.
$	从末端开始匹配.

2.1 点运算符 `.`

.是元字符中最简单的例子。
.匹配任意单个字符，但不匹配换行符。
例如，表达式.ar匹配一个任意字符后面跟着是a和r的字符串。

".ar" => The car parked in the garage.

简写	描述
.	除换行符外的所有字符
\w	匹配所有字母数字，等同于 `[a-zA-Z0-9_]`
\W	匹配所有非字母数字，即符号，等同于： `[^\w]`
\d	匹配数字： `[0-9]`
\D	匹配非数字： `[^\d]`
\s	匹配所有空格字符，等同于： `[\t\n\f\r\p{Z}]`
\S	匹配所有非空格字符： `[^\s]`
\f	匹配一个换页符
\n	匹配一个换行符
\r	匹配一个回车符
\t	匹配一个制表符
\v	匹配一个垂直制表符
\p	匹配 CR/LF（等同于 `\r\n`），用来匹配 DOS 行终止符

符号	描述
?=	正先行断言-存在
?!	负先行断言-排除
?<=	正后发断言-存在
?<!	负后发断言-排除

标志	描述
i	忽略大小写。
g	全局搜索。
m	多行修饰符：锚点元字符 `^` `$` 工作范围在每行的起始。

GitHub标星4.1w，超火的正则表达式学习教程，速速收藏~

GitHub标星4.1w，超火的正则表达式学习教程，速速收藏~

什么是正则表达式？

目录

1. 基本匹配

2. 元字符

2.1 点运算符 .

2.2 字符集

2.2.1 否定字符集

2.3 重复次数

2.3.1 * 号

2.3.2 + 号

2.3.3 ? 号

2.4 {} 号

2.5 (...) 特征标群

2.6 | 或运算符

2.7 转码特殊字符

2.8 锚点

2.8.1 ^ 号

2.8.2 $ 号

3. 简写字符集

4. 零宽度断言（前后预查）

4.1 ?=... 正先行断言

4.2 ?!... 负先行断言

4.3 ?<= ... 正后发断言

4.4 ?<!... 负后发断言

5. 标志

5.1 忽略大小写 (Case Insensitive)

5.2 全局搜索 (Global search)

5.3 多行修饰符 (Multiline)

6. 贪婪匹配与惰性匹配 (Greedy vs lazy matching)

2.1 点运算符 `.`

2.3.1 `*` 号

2.3.2 `+` 号

2.3.3 `?` 号

2.4 `{}` 号

2.5 `(...)` 特征标群

2.6 `|` 或运算符

2.8.1 `^` 号

2.8.2 `$` 号

4.1 `?=...` 正先行断言

4.2 `?!...` 负先行断言

4.3 `?<= ...` 正后发断言

4.4 `?<!...` 负后发断言