正则表达式

最新推荐文章于 2024-10-17 18:58:27 发布

titxixYY

最新推荐文章于 2024-10-17 18:58:27 发布

阅读量834

点赞数 11

文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/titxixYY/article/details/142317791

版权

import re

一、正则表达式就是在文本中，查找符合模式字符串的子字符串。

. 表示匹配任意一个有效字符

\w 表示匹配一个有效字符(任何字母数字 _)

\W 表示匹配一个非有效字符

\d 表示匹配一个数字字符

\D 表示匹配一个非数字字符

\s 表示匹配一个空格字符

\S 表示匹配一个非空格字符

[] 表示匹配一个符合中括号中范围的字符

[^] 表示匹配一个不符合中括号中范围的字符

s = "我今年18岁，我喜欢6岁那年的夏天,hello"

search 只返回第一个符合模式的结果

result = re.search("[^a-zA-Z]", s)

print("search的结果", result)

findall 返回所有符合模式字符串的结果

result = re.findall("[^a-zA-Z]", s)

print("findall的结果", result)

二、表示长度的模式字: 他会修饰前一个字符，表示前一个字符出现的次数

? 出现0次或者出现1次 [0,1]

* 出现0次或者多次[0,无穷]

+ 出现1次或者多次[1,无穷]

{m,n} 出现m次或者n次[m,n]

{m,} 出现至少m次 [m,无穷]

{,n} 出现至多n次 [0,n]

{m} 出现m次 [m]

s = "我今年18岁，我喜欢6岁那年的夏天,我的电话号码是18812345678"

正则表达式默认情况下是贪婪模式：匹配结果是尽可能多的字符

懒惰模式：匹配结果是尽可能少的字符?如果出现在表示长度的模式字之后，贪婪模式就会被切换为懒惰模式

result = re.search("https?", s) 字符s可以有也可以没有

print("search的结果", result)

result = re.findall("\d+?", s) 匹配一个至少有一位的数字

print("search的结果", result)

匹配正则语法中包含那些符号

s = r"我今年18岁...\我喜欢6岁那年的夏天,\我的电话号码是18812345678"

result = re.findall(r"\\", s) # 匹配一个至少有一位的数字

print("search的结果", result)

三、表示边界匹配的符号

^ 表示的从字符串头开始匹配

$ 表示匹配字符串的尾

\b 表示单词的边界匹配:非字母字符将两段字母字符串隔开,例如:"i am,your teacher.i am so happy!"

s = r"我今年18岁...我喜欢6岁那年的夏天,我的电话号码是18812345678"

result = re.findall(r"^我", s)

print(result)

result = re.findall(r"\d+$", s)

print(result)

整则现在，在一篇文章中匹配其中的手机号码

\d{11}

分组 :

1.使用效果将多种匹配写在一个分组中，匹配之间使用 | 进行分割

s1 = "https://www.baidu.com"

s2 = "http://www.baidu.com"

result = re.search(r"https?.*", s1)

print(result)

result = re.search(r"https?.*", s2)

print(result)

result = re.search(r"(http:.*|https:.*)", s1)

print(result)

result = re.search(r"(http:.*|https:.*|)", s2)

print(result)

2.提取子串

在正则表达式中如果要引用分组中正则表达式，无需重复书写直接\数字即可应用该数字对应的分组

s1 = "<https<://www.baidu.com"

s2 = "http://www.baidu.com"

result = re.search("(https?://)(.*)", s1)

print(result)

print(result.group(1))

print(result.group(2))

关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

titxixYY CSDN认证博客专家 CSDN认证企业博客

码龄49天

24: 原创

49万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

442: 积分

122: 粉丝

201: 获赞

1: 评论

217: 收藏

私信

关注

热门文章

最新评论

python 运算符
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python 新手
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619288817。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。