python正则表达式（常用部分）

最新推荐文章于 2024-08-27 16:38:10 发布

qq_41516672

最新推荐文章于 2024-08-27 16:38:10 发布

阅读量130

点赞数

文章标签： python 正则表达式

本文链接：https://blog.csdn.net/qq_41516672/article/details/98029132

版权

python正则表达式（常用部分）

简要：python正则表达式是指符合一定规则的字符串；
如：手机号（首数字为1，总长度为11）、
邮箱（首段字符(5位到20位)+@+(163、qq、126)+.+com）。

1.re模块简单操作

1.match(pattern,string,flags=0).group()返回一个匹配的对象
flags：默认是0，表示从字符串的起始位置
pattern:指匹配的正则表达式子
string:指需要匹配的文段
group():默认为0
re.match(‘h’,‘h’).group()
‘h’

re.match('h','h').group()
	'h'
re.match('h','hallo').group()
	'h'

字符类型

.	匹配除’\n’之外任何单个字符，如果要匹配’\n’,使用[’\n’]
\d	匹配数字字符,[0-9]
–	–
\D	[^0-9]匹配非数字
–	–
\s	匹配任何空白字符,[\f\n\r\t\v]
–	–
\S	非空白,[^\f\r\t\v]
–	–
\w	任何单词字符[A-Za-z0-9_]
–	–
\W	非单词
–	–

**'.'**
re.match('.','a').group()
'a'
re.match('.','帅').group()
'帅'
**r'\d'**
re.match('\\d','1').group()
'1'
re.match('\d','1').group()
'1'
re.match(r'\d','1').group()
'1'
**r'\D'**
re.match(r'\D','q').group()
'q'
**'r\s'**
re.match(r'\s','\n').group()
'\n'
**'r\w'**
re.match(r'\w','a1_').group()
'a1_'
**'r\W'**
re.match(r'\W','\n').group()
'\n'

原始类型
r"正则表达式"
r表示原始字符串，在正则表达式里需要’‘作为转义字符，这时需要’\‘双杆,加上r’'就可以写原始类型

import re
re.match('E:\\\\','E:\\src\\source').group()
'E:\\'
#r'原始类型'
re.match(r'E:\\','E:\\src\\source').group()
'E:\\'

x?	表示一次或者零次
x*	表示x零次或多次
–	–
x+	表示x一次或者多次
–	–
x{n}	恰好n次
–	–
x{n,}	至少n次
–	–
x{n,m}	至少n次，至多m次
–	–

re.match(r'[0-9]{1}[0-9]?','1234567').group()
'12'
re.match(r'[0-9]{1}[0-9]+','1234567').group()
'1234567'
re.match(r'[0-9]{1}[0-9]{1,2}','1234567').group()
'123'
re.match(r'[0-9]{1}[0-9]*','1234567').group()
'1234567'

XY	获取XY,或者X,Y
X	Y
–	–

re.match(r'b|a','b1aa').group()
'b'
re.match(r'[XY]','Y').group()
'Y'

^	取反
$	限定结尾内容
–	–
\b	常用截取开头结尾

多个实用方法（match，search，findall）
re.match(regax,msg).group()----->找到符合匹配的元素

import re
msg='123abc'
result=re.match(r'\d*',msg).group()
print(result)
123

ps:$是指限制结尾的语句

print(re.match(r'[0-9a-zA-Z_]{4,20}@(163|126|qq|gmail)\.com$','123412@163.com').group())
123412@163.com```

import re
msg=‘aa123abc’
result=re.search(r’\d+’,msg).group()
print(result)
123


re.findall(regax,msg)------->找到msg中所有符合正则表达式的字符串。并返回列表形式

import re
msg=‘aa123ab1c2’
result=re.findall(r’\d+’,msg)
print(result)
[‘123’, ‘1’, ‘2’]

re.sub(regax.replace,info)-------->找到符合正则表达式的info，并以replace取代

import re
replace=‘1111’
info=’’’
你好，你的验证码为
123456
‘’’
result=re.sub(r’\b\d+\b’,replace,info)
print(result)

贪婪模式与非贪婪
*,+为贪婪模式，尽可能的获取更多匹配元素
?为非贪婪模式，尽可能的获取少匹配元素

import re
msg=“your number 44-33-22-11”
result=re.match(r’.+(\d±\d±\d+)’,msg).group(1)
print(result)
#3-22-11----.后的+就贪婪模式仅留下必须固有格式
result=re.match(r’.+?(\d±\d±\d+)’,msg).group(1)
print(result)
#44-33-22----.后+？就为非贪婪，在其它贪婪模式尽可能贪婪后，才接受剩余的匹配值

qq_41516672

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python正则表达式（常用部分）

python正则表达式（常用部分）简要：python正则表达式是指符合一定规则的字符串；如：手机号（首数字为1，总长度为11）、邮箱（首段字符(5位到20位)+@+(163、qq、126)+.+com）。1.re模块简单操作1.match(pattern,string,flags=0).group()返回一个匹配的对象flags：默认是0，表示从字符串的起始位置pattern:指匹配...
复制链接

扫一扫