python正则表达式(常用部分)

python正则表达式(常用部分)

简要:python正则表达式是指符合一定规则的字符串;
如:手机号(首数字为1,总长度为11)、
邮箱(首段字符(5位到20位)+@+(163、qq、126)+.+com)。

1.re模块简单操作

1.match(pattern,string,flags=0).group()返回一个匹配的对象
flags:默认是0,表示从字符串的起始位置
pattern:指匹配的正则表达式子
string:指需要匹配的文段
group():默认为0
re.match(‘h’,‘h’).group()
‘h’

re.match('h','h').group()
	'h'
re.match('h','hallo').group()
	'h'

字符类型

.匹配除’\n’之外任何单个字符,如果要匹配’\n’,使用[’\n’]
\d匹配数字字符,[0-9]
\D[^0-9]匹配非数字
\s匹配任何空白字符,[\f\n\r\t\v]
\S非空白,[^\f\r\t\v]
\w任何单词字符[A-Za-z0-9_]
\W非单词
**'.'**
re.match('.','a').group()
'a'
re.match('.','帅').group()
'帅'
**r'\d'**
re.match('\\d','1').group()
'1'
re.match('\d','1').group()
'1'
re.match(r'\d','1').group()
'1'
**r'\D'**
re.match(r'\D','q').group()
'q'
**'r\s'**
re.match(r'\s','\n').group()
'\n'
**'r\w'**
re.match(r'\w','a1_').group()
'a1_'
**'r\W'**
re.match(r'\W','\n').group()
'\n'

原始类型
r"正则表达式"
r表示原始字符串,在正则表达式里需要’‘作为转义字符,这时需要’\‘双杆,加上r’'就可以写原始类型

import re
re.match('E:\\\\','E:\\src\\source').group()
'E:\\'
#r'原始类型'
re.match(r'E:\\','E:\\src\\source').group()
'E:\\'
x?表示一次或者零次
x*表示x零次或多次
x+表示x一次或者多次
x{n}恰好n次
x{n,}至少n次
x{n,m}至少n次,至多m次
re.match(r'[0-9]{1}[0-9]?','1234567').group()
'12'
re.match(r'[0-9]{1}[0-9]+','1234567').group()
'1234567'
re.match(r'[0-9]{1}[0-9]{1,2}','1234567').group()
'123'
re.match(r'[0-9]{1}[0-9]*','1234567').group()
'1234567'
XY获取XY,或者X,Y
XY
re.match(r'b|a','b1aa').group()
'b'
re.match(r'[XY]','Y').group()
'Y'

^取反
$限定结尾内容
\b常用截取开头结尾

多个实用方法(match,search,findall)
re.match(regax,msg).group()----->找到符合匹配的元素

import re
msg='123abc'
result=re.match(r'\d*',msg).group()
print(result)
123

ps:$是指限制结尾的语句

print(re.match(r'[0-9a-zA-Z_]{4,20}@(163|126|qq|gmail)\.com$','123412@163.com').group())
123412@163.com```

import re
msg=‘aa123abc’
result=re.search(r’\d+’,msg).group()
print(result)
123


re.findall(regax,msg)------->找到msg中所有符合正则表达式的字符串。并返回列表形式

import re
msg=‘aa123ab1c2’
result=re.findall(r’\d+’,msg)
print(result)
[‘123’, ‘1’, ‘2’]

re.sub(regax.replace,info)-------->找到符合正则表达式的info,并以replace取代

import re
replace=‘1111’
info=’’’
你好,你的验证码为
123456
‘’’
result=re.sub(r’\b\d+\b’,replace,info)
print(result)

贪婪模式与非贪婪
*,+为贪婪模式,尽可能的获取更多匹配元素
?为非贪婪模式,尽可能的获取少匹配元素

import re
msg=“your number 44-33-22-11”
result=re.match(r’.+(\d±\d±\d+)’,msg).group(1)
print(result)
#3-22-11----.后的+就贪婪模式仅留下必须固有格式
result=re.match(r’.+?(\d±\d±\d+)’,msg).group(1)
print(result)
#44-33-22----.后+?就为非贪婪,在其它贪婪模式尽可能贪婪后,才接受剩余的匹配值


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值