Python进阶(七) -- 正则表达式

哈哈钟

已于 2022-11-17 22:04:44 修改

阅读量139

点赞数

分类专栏： python 实用工具文章标签：正则表达式

于 2022-11-17 22:02:25 首次发布

本文链接：https://blog.csdn.net/zzt3344/article/details/127912913

版权

python 同时被 2 个专栏收录

17 篇文章 2 订阅

订阅专栏

实用工具

6 篇文章 1 订阅

订阅专栏

正则表达式

正则表达式又称为规则表达式.正则表达式通常用于检索、替换那些符合那些符合摸个规则的文本。

作用：

测试字符串的某个模式，即数据有效性验证
实现按照某种规则替换文本
根据模式匹配从字符串中提取一个子字符串

构成：

原子（普通字符，如英文字母）
元字符（有特殊功能的字符）
模式修正字符

匹配单字符

字符	匹配范围
.	匹配任意1个字符（除了\n）
[]	匹配[]中列举的字符
\d	匹配数字0-9
\D	匹配非数字
\s	匹配空白，即空格，\t-Tab键，\n换行
\S	匹配非空白
\w	匹配单词字符，即a-z，A-Z，0-9，_
\W	匹配非单词字符

匹配多个字符

字符	功能
*	匹配前一个字符出现0次或多次，即可有可无
+	匹配前一个字符出现1次或多次，即至少出现一次
？	匹配前一个字符出现0次或1次，即要么出现一次要么不出现
{m}	匹配前一个字符出现m次
{m,n}	匹配前一个字符出现m到n次

匹配开头结尾

字符	功能
^	匹配字符串开头
$	匹配字符串结尾

注意：当^在[]中时表示取反：[^h]匹配不是h的字符

匹配分组

字符	功能
\|	匹配左右任意一个表达式
(ab)	将括号中的字符作为一个分组
\num	引用分组num匹配到的字符串
(?P<name>)	分组起别名
(?P=name)	引用别名为name分组匹配到的字符串

re模块

match匹配

re.match(pattern,string,flags=0):

从头匹配一个符合规则的字符串，从起始位置开始匹配，匹配成功返回一个对象，未成功返回None

pattern：正则模型
string：要匹配的字符串
faigs：匹配模式

match()方法一旦匹配成功，就是一个match object对象，有以下方法：

group():返回被re匹配的字符串
start():返回匹配开始的位置
end():返回匹配结束的位置
span():返回一个元组包含匹配（开始，结束）的位置

示例:

"""
1 导入模块
2. 通过match验证正则
3. 判断验证是否正确
4. 如果成功获取匹配结果
"""
# 1 导入模块
import re

str1 = 'hahazhong@qq.com'

# 2. 通过match验证正则
result = re.match('\w*@qq\.com', str1)
print(result)
# 3. 判断验证是否正确
# 4. 如果成功获取匹配结果
if result:
    print('匹配成功')
    print('匹配结果:', result.group())
else:
    print('匹配失败')