【21天Python进阶学习挑战赛】[day2]正则表达式大总结-CSDN博客

本文链接：https://blog.csdn.net/yxz8102/article/details/126134239

活动地址：CSDN21天学习挑战赛

学习日记

学习知识点

re模块：100天精通Python（进阶篇）——第34天：正则表达式大总结_无羡ღ的博客-CSDN博客

1、re模块操作

导入re模块
使用 result = re.match(pattern, string, flags=0)

参数说明：

pattern：匹配的正则表达式
string：要匹配的字符串。
flags：标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

返回说明：

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，result为none。

result.group()为匹配的值。

2、匹配单个字符

字符功能
. 匹配任意1个字符（除了\n）
[ ] 匹配[ ]中列举的字符
\d 匹配数字，即0-9
\D 匹配非数字，即不是数字
\s 匹配空白，即空格，tab键
\S 匹配非空白
\w 匹配单词字符，即a-z、A-Z、0-9、_
\W 匹配非单词字符

3、匹配多个字符

字符功能
* 匹配前一个字符出现0次或者无限次，即可有可无
+ 匹配前一个字符出现1次或者无限次，即至少有1次
? 匹配前一个字符出现1次或者0次，即要么有1次，要么没有
{m} 匹配前一个字符出现m次
{m,n} 匹配前一个字符出现从m到n次

4、匹配开头结尾

字符   功能
^   匹配字符串开头
$   匹配字符串结尾

5、匹配分组

字符功能
(ab) 将括号中字符作为一个分组
\num 引用分组num匹配到的字符串
(?P<name>) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串

示例4：\num用法

需求：匹配出<html><h1>www.itcast.cn</h1></html>

import re

labels = ["<html><h1>www.itcast.cn</h1></html>", "<html><h1>www.itcast.cn</h2></html>"]

for label in labels:
    ret = re.match(r"<(\w*)><(\w*)>.*</\2></\1>", label)
    if ret:
        print("%s 是符合要求的标签" % ret.group())
    else:
        print("%s 不符合要求" % label)
输出结果：

<html><h1>www.itcast.cn</h1></html> 是符合要求的标签
<html><h1>www.itcast.cn</h2></html> 不符合要求

示例5：(?P<name>) (?P=name)用法

需求：匹配出<html><h1>www.itcast.cn</h1></html>

>>> import re

>>> ret = re.match(r"<(?P<name1>\w*)><(?P<name2>\w*)>.*</(?P=name2)></(?P=name1)>", "<html><h1>www.itcast.cn</h1></html>")
>>> print(ret.group())
<html><h1>www.itcast.cn</h1></html>

>>> ret = re.match(r"<(?P<name1>\w*)><(?P<name2>\w*)>.*</(?P=name2)></(?P=name1)>", "<html><h1>www.itcast.cn</h2></html>")
>>> print(ret.group())
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'