正则表达式

本文详细介绍了Python中正则表达式的使用,包括匹配单个和多个字符、re模块的match、search、findall、sub和split方法,以及原始字符串r的作用。强调了re.match与re.search的区别,并指出re.findall能匹配所有子串。原始字符串在爬虫中应用广泛。
摘要由CSDN通过智能技术生成

匹配单个字符

"""
.    匹配任意一个字符(除了\n)
[]   匹配[]中列举的字符
\d   匹配数字,即0-9
\D   匹配非数字,即不是数字
\s   匹配空白,即 空格,tab键
\S   匹配非空白
\w   匹配单词字符,即a-z  A-Z   0-9  _
\W   匹配非单词字符
"""

import re

# 使用match方法进行匹配操作
# 普通的
ret0 = re.match(r"速度与激情A", "速度与激情AA")
# []  匹配[]中列举的字符
ret = re.match(r"速度与激情[1-36-8a-zB-E]", "速度与激情E")
# \w  范围很广 慎用
ret1 = re.match(r"速度与激情\w", "速度与激情哈")
# \d  匹配数字,即0-9
ret2 = re.match(r"速度与激情 \d", "速度与激情 9")
# \s  匹配空白,即 空格,tab键
ret3 = re.match(r"速度与激情\s\d", "速度与激情 0")
#  .  匹配任意一个字符(除了\n)  范围最广
ret4 = re.match(r"速度与激情.", "速度与激情#")

# 如果上一步匹配到数据的话,可以用group方法获取数据
print(ret0.group())
print(ret.group())
print(ret1.group())
print(ret2.group())
print(ret3.group())
print(ret4.group())

匹配多个字符

import re

# {}: {m}匹配前一个字符出现m次  {m,n}匹配前一个字符出现m到n次
ret = re.match(r"速度与激情A{1,3}", "速度与激情AA")
ret1 = re.match(r"021-\d{8}", "021-12345678")
# ? :  匹配前一个字符出现0次或1次,即要么有1次,要么没有
ret2 = re.match(r"021-?\d{8}", "02112345678")
# + :  匹配前一个字符出现1次或无限次,即至少有1次

# * :  匹配前一个字符出现0次或无限次,即可有可无
ret4 = re.match(r"021-*\d{8}", "021-----12345678")
ret5 = re.match(r".*", "&&&0")

print(ret
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值