全网最通俗易懂的正则表达式讲解,以例子来讲解

正则表达式:

正则表达式在线测试工具:https://regex101.com/

百度百科解释正则表达式为正则表达式是对字符串操作的一种逻辑公式

我们可以将正则表达式理解为一种规则,自己设定的一种规则,让计算机根据这个规则来找到你需要的字符串。但是这个规则你怎么制定,当然不能瞎制定,对电脑说:”你给我找到这篇文章的所有包含刘德华的句子(字符串)!“,电脑当然不懂,所以我们下面交代一些符号,让你正确的建立正则表达式,建立规则,让电脑能帮你找到你想要的字符。

文末有正则表达式的最常见应用。

基本用法

  1. ?: 表示?前面的字符需要出现0次或一次。简单来说就是?前面的字符可有可无。比如你输入一个正则表达式tea?,那么计算机就会找到te,tel这样的字符串。
  2. *:表示*前面的字符需要出现0个或多次。比如你输入一个正则表达式ab*c,那么计算机就会找到ac,abc,abbbbbc这样的字符串。
  3. +:表示+前面的字符需要出现1次以上。比如你输入一个正则表达式ab+c,那么计算机就会找到abc,abbbbc这样的字符串。
  4. {}:精确匹配:想匹配几次就匹配几次。比如你输入一个正则表达式ab{6}c,那么计算机就会找到abbbbbbc这样的字符串。你输入一个正则表达式ab{2,6}c,那么计算机就会找到abbc,abbbc,abbbbc,abbbbbc,abbbbbbc这样的字符串。ab{2,}c的话就是b出现两次以上。

以上单个限定符规则就讲完了,如果是想让字符串出现一定次数的话,用()括起来就好了。比如(ab)+c,文章中ababababc等满足规则的字符串就会被找到。

中级用法

或运算符:|,如a (baby|mom),文章就会找到a baby或a mom。

字符类:[],可以匹配由框内字符构成的字符串。比如制定正则表达式[alo]+,那么afsgsglo就可以被找到(匹配到),因为afsgsglo中包含alo。相对于()的区别就是它不讲顺序,只要存在即可。常用例子:[a-zA-Z0-9]+。

非运算符:^,一般放在表达式前面,表示除了他们以外的字符都可被匹配。比如你天生不能见到大写字母,见到了就想吐,你就可以输入正则表达式[ ^A-Z]+。

元字符:

编号示例说明
1.匹配除换行符以外的任何字符
2\d匹配数字:[0-9]
3\D匹配非数字:[^0-9]
4\s匹配空格字符:[\t\r\n\f]
5\S匹配非空格:[^\t\r\n\f]
6\w匹配单字字符: [A-Za-z0-9_]
7\W匹配非单字字符: [ ^A-Za-z0-9_]

匹配行首,如a^,只能找到行首出现a的字符串。如afff。

匹配行尾,如a$,只能找到行尾出现a的字符串。如llla。

高级用法:

贪婪匹配与懒惰匹配:

贪婪匹配就是匹配尽可能多。懒惰匹配就是匹配尽可能少。

如你想在

<div><span>hello world</span></div>

里匹配出标签div和span。

我们不自觉地就想用<.+>,<>里面只要有东西就匹配。

但是最后的结果是:

共找到 1 处匹配:
<div><span>hello world</span></div>

我们将贪婪匹配转为懒惰匹配,将正则表达式改为<.+?>,则最后结果为:

共找到 4 处匹配:
<div>
<span>
</span>
</div>

便完成了。

常见应用

正则表达式判断密码python代码:

import re

lower = re.compile('[a-z]')
upper = re.compile('[A-Z]')
digit = re.compile('[0-9]')
wrong = re.compile('[^a-zA-Z0-9]')

while True:
    password = input('请输入大于8位的包含大小写字母和数字的密码:')
    if len(password) < 8:
        print('输入的密码小于8位')
    elif wrong.search(password) != None:
        print('包含无效字符')
    else:
        if lower.search(password) == None:
            print('未包含小写字母')
        elif upper.search(password) == None:
            print('未包含大写字母')
        elif digit.search(password) == None:
            print('未包含数字')
        else:
            print('输入成功')
            break
<think>好的,我现在需要给用户讲解正则表达式,得用通俗易懂的方式。首先,我得理解用户的需求。他们可能对编程有一定了解,但正则表达式看起来复杂,需要简化。 首先,我应该从比喻入手,比如把正则表达式比作通配符,但更强大。这样用户容易联想到已有的知识。比如,用户可能知道在文件搜索中用*代表任意字符,正则表达式类似但功能更多。 接下来,需要介绍基本概念,比如元字符。用户可能不熟悉这些术语,所以要用例子说明。比如,\d代表数字,.代表任意字符,这样具体的例子能帮助记忆。 然后,要分步骤讲解,比如先讲匹配单个字符,再讲量词、分组和选择。这样结构清晰,用户容易跟上。每个部分都要有例子,比如用电话号码和邮箱的匹配作为实例,这样实用性强。 还要注意用户的常见问题,比如贪婪模式,可能需要用简单的话解释,避免太技术化。比如,提到量词默认尽可能多匹配,而加?变成尽可能少,这样对比容易理解。 后,给出总结和练习建议,帮助用户巩固。可能还要提醒正则表达式在不同语言中的差异,避免用户混淆。 检查是否需要遵循用户的格式要求,比如行内公式用$...$,独立公式用$$...$$。但这里讲正则表达式可能用不到数学公式,不过如果有涉及,比如讲到重复次数时用{n,m},可能需要用代码格式而非数学公式。但根据用户给的系统指令,可能不需要,所以确保用反引号包裹代码示例。 还要确保用中文,结构清晰,分点讲解,步骤化。避免使用专业术语过多,必要时解释术语。比如“元字符”需要解释为“特殊字符”。 可能还需要检查是否有错误,比如正则表达式中的转义字符是否正确,比如\.表示真正的点号,而用户可能容易忽略反斜杠的作用,需要强调。 总之,结构大致是:比喻引入 -> 基本概念 -> 组成部分分点讲解 -> 实例 -> 注意事项 -> 总结。每个部分用例子和简单语言,确保用户能逐步理解。</think>让我们用“通配符升级版”来通俗理解正则表达式: ✍️ 简单理解:正则表达式就像超级智能的**文本搜索密码**,用特定符号组合快速完成以下任务: - ✅ 检测文本规律(如判断手机号格式) - ✅ 批量提取信息(如从网页抓取所有邮箱) - ✅ 智能替换内容(如给所有数字加粗) 🔑 核心学习路径(分三步): 1. **单个字符匹配** - `\d` = 匹配任意数字(相当于`[0-9]`) - `\w` = 匹配字母/数字/下划线(相当于`[A-Za-z0-9_]`) - `.` = 匹配任意字符(除换行符) - 举例:`A\d` 可以匹配 "A3"、"A9" 2. **数量控制符** - `*` = 出现0次或多次(贪婪模式) - `+` = 出现1次或多次 - `?` = 出现0或1次(也可用于非贪婪模式) - `{2}` = 精确出现2次 - 举例:`AB+` 匹配 "AB"、"ABBB" 3. **位置与逻辑** - `^` = 字符串开头 - `$` = 字符串结尾 - `|` = 或逻辑(如`猫|狗`) - `()` = 捕获分组 - 举例:`^Hello` 只匹配开头的Hello 🛠️ 经典使用场景: ```regex 电话号匹配:^1[3-9]\d{9}$ // 匹配11位手机号 邮箱匹配:\w+@[a-z0-9]+\.[a-z]+ // 匹配简单邮箱格式 HTML标签提取:<(.*?)> // 非贪婪模式匹配标签 ``` ❗ 重要注意事项: 1. 特殊字符需转义(如匹配真正的`.`要写成`\.`) 2. 默认**贪婪匹配**(加`?`变非贪婪:`.*?`) 3. 不同编程语言实现有细微差异 🔍 学习方法建议: 1. 先用在线测试工具(如regex101.com)实时验证 2. 从简单模式开始逐步增加复杂度 3. 善用预置字符集(如`\s`匹配空白符) 通过掌握这些核心规则,您就能快速编写出匹配身份证号、URL解析、文本清洗等实用表达式啦!
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值