程序员必备知识 01 正则表达式

牟泉禹[Dark Cat]

于 2021-07-20 09:22:07 发布

阅读量292

点赞数

分类专栏：学习笔记文章标签：正则表达式程序员必备知识

BY-牟泉禹/MuQuanyu

本文链接：https://blog.csdn.net/qq_52606908/article/details/118925699

版权

学习笔记专栏收录该内容

387 篇文章 11 订阅

订阅专栏

"本文详细介绍了正则表达式的基础知识，包括顺序重要性、特殊字符的转义、常用转义字符及其用途，如d、D、w、W等。还讲解了量词的概念，如*、+、?以及使用方法，并通过实例展示了如何匹配电话号码和邮箱地址。此外，文章还探讨了分组和实战练习，如邮箱和URL的正则匹配规则。"

摘要由CSDN通过智能技术生成

1.1 正则表达式

正则表达式，又称规则表达式。（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

我们许多的程序语言，都是内置正则表达式，对我们写的代码进行判断和处理的。

无论您用 Python、JavaScript 或 Java ，正则表达式都不是它们的独特标准，而是具有一个很规范的统一。学会通用正则才能更好的把它用于这些编程语言中。我们经常会用它处理大量的字符串文本和命令行！

正则表达式是略微复杂的，这也证明正则可以帮你做很多事。(你能够想象？正则几乎可以处理任何情况的文本吗？)

1.1.1 直奔主题

顺序很重要

当你如数 ABC 和 BCA 的时候匹配到的完全就是两个东西，（当然大小写字母是不会被区分的！）这属于精准搜索。你输入的正则也必须精准。

一些特殊字符需要转义才能搜索

比如说：.[{()^$ | ?*+

当我们只输入一个 . 的时候。
你会发现它做了一个比较奇怪的操作，它会把所有的字符都搜索出来，也就是说对于它来说，所有的单个字符都是匹配的！
在这里插入图片描述
而当你在特殊字符前面加一个反斜杠的时候，它就只会搜索点或句点。（这就是转义字符）

转义字符的魅力

\d ：搜索 0-9 的一个数字
\D : 不搜索 0-9 的一个数字
\w ：搜索 a-z、A-Z、0-9、_ 的一个字符（下划线）（不搜索特殊字符）
\W ：不搜索 a-z、A-Z、0-9、_ 的一个字符（下划线）（就搜索特殊字符）
\s ：搜索 space（空格）、tab（制表符）、newline（新的换行）的一个字符
\S ：不搜索空格、制表符和换行符的一个字符

！！下面的转义字符实际上不匹配任何字符（所以它们被称为锚点）！！

\b ：针对词边界的搜索（\bHa 意思是 Ha词边界Ha 就只能搜到边界后面的Ha，而不能搜索到前面没有词边界的 Ha）
词边界：就是空格、换行符、制表符！
\B ：不针对词边界来搜索。（\BHa 它就只能搜索到前面没有空格、换行符、制表符的 Ha）
^ : 针对于一行字符串的开头来进行搜索
$ ：针对于一行字符串的结尾来进行搜索的。

实战：匹配分隔符为（- .）的电话号码

在这里插入图片描述
. 只能匹配一个任意字符

上述的方法其实可以很好的解决，但是我们会遇到一个致命的问题。当我们出现并非正确分隔符的电话号码时：

在这里插入图片描述
它居然也会进行匹配！这要怎么办呢，我们只需要匹配分隔符是 . 或 - 的就可以了。

[] :字符集符号，**意思是只要出现了 [] 里面的一个字符，就会被匹配！！ **
正则格式：\d\d\d[.-]\d\d\d[.-]\d\d\d\d

[a-z]：就是只要碰到 a-z 其中一个字符就匹配
[0-9]：就是只要碰到 0-9 其中一个字符就匹配
所以 \d \w 这些只是对 [] 字节集进行了封装而已呀。

[^]：意思是非！就是不能匹配那些字符！！

[^a]：就是不能匹配 a 这个字符。 在这里插入图片描述

[^a-z]：就是不能匹配 a-z 任意一个字符。。

（）：指的是一组，就是把一个匹配的正则包含起来，当成一个整体来处理！

1.1.2 Quantifiers 量词

* ：匹配 0 次或多次（至少匹配0次）
+ ：匹配 1 次或多次（至少匹配1次）
? ：匹配 0 次或 1次（该字符可有可无）
a{3}：匹配 a 字符 3次
==a{3,4}：最少匹配 a 字符 3次，最多匹配 4次 ==
() 和 | 的使用

() 可以处理我们 [] 处理不了的东西，这是因为 [] 只能匹配一个字符，而 () 却可以把多个正则匹配包括起来，形成一个组！而不是仅限于一个字符！！！

在这里插入图片描述
如果学完了以上所有的基础知识，那我们就可以做一些实战练习了。

1.1.3 实战练习

邮箱判定

CoreyMSchafer@gamil.com
CoreyMSchafer@gamil.cao.com
corey.schafer@university.edu
cor.ey.schafer@university.edu
corey-321schafer@my-work.net
corey-321-schafer@my-work.net
99565687@qq.com

正则表达式：[\w\d]+[\.-]?[\w\d]+[\.-]?[\w\d]+@[\w\d]+(\.[\w\d]+(\.[\w\d]+)?|-[\w\d]+\.[\w\d]+)

在这里插入图片描述
2. URL判定