本文章以授权于微信公众号:HarLearn
有什么建议可以到公众号里进行留言。
在上一篇文章Python之正则表达式基础语法中我们简单的学习了正则表达式的一些基础语法,今天这篇文章将讲一下python如何使用正则表达式,它有那些方法。
正则表达式模块(re)内容
re模块是python的一个库,里面有很多方法可以对正则表达式进行运用。
re.search(pattern,string,flags = 0)
参数 | 描述 |
---|---|
pattern | 正则表达式 |
string | 要匹配的字符串 |
flags | 标志值,用于改变正则表达式的行为 |
flags
有哪些值:
标志 | 含义 |
---|---|
re.S(DOTALL) | 使. 匹配包括换行在内的所有字符 |
re.I(IGNORECASE) | 使匹配对大小写不敏感 |
re.L(LOCALE) | 做本地化识别(locale-aware)匹配,法语等 |
re.M(MULTILINE) | 多行匹配,影响^ 和$ |
re.X(VERBOSE) | 该标志通过给予更灵活的格式以便将正则表达式写得更易于理解 |
re.U(UNICODE) | 根据Unicode字符集解析字符。在python3 是多余的,python3 默认使用Unicode 字符串 |
re.A(ASCII) | 使\w ,\W ,\b ,\B ,\d ,\D ,\s 和\S 只执行ASCII 匹配而不完全是Unicode 匹配。 |
**注:**下面方法中的同名参数和上述介绍的参数意思一样,将不再过多的解释。
作用:从左到右扫描整个字符串 返回第一个与正则表达式匹配的对象,如果没有匹配成功就返回None
比如: 查找 字符串中 CodeId 第一次出现的位置
import re
text = 'Welcome to CodeId. CodeId'
result = re.search(r'CodeId',text)
print(result.start())
# 结果为:11
**注:**返回的result
为匹配对象,其中result.start()
是返回开始匹配的位置索引。由此我们可以猜到result.end()
应该是返回匹配结束时的位置索引。
re.match(pattern,string,flags = 0 )
作用:查找字符串开头的零个或几个字符是否与正则表达式匹配,如果成功则返回相应的匹配对象,否则返回None
比如:判断 python变量 的开头是否是数字。
result = re.match(r'\d+','123CodeId')
if result :
print("python变量 的开头含有数字")
# 结果为:python变量 的开头含有数字
注意:re.match()
只会匹配字符串的开头,即使在MULTILINE
(多行)模式下,也不会匹配每行的开头。
result = re.match(r'a','b\na',re.MULTILINE)
print(result)
# 结果为:None
# 证明匹配失败
re.fullmatch(pattern,string,flags = 0 )
作用:如果整个字符串都与正则表达式匹配,则返回相应的匹配对象,否则返回None
比如:判断输入的邮箱是否合法
# 判断输入的邮箱是否合法
email = '[email protected]'
result = re.fullmatch(r'^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$',email)
if result :
print("你输入的邮箱:",result.group(),"是合法的")
# 结果为:你输入的邮箱: [email protected] 是合法的
注:result.group()
是匹配对象的一个方法,作用是:返回匹配的所有子串。后面会进行详细介绍。
re.split(pattern,string,maxsplit = 0,flags = 0 )
作用:以字符串中与正则表达式匹配的子串,为分隔符,对字符串进行分割。返回分割之后的列表。
比如:把英文句子分割为单词组成的列表
text = 'Welcome to CodeId'
result = re.split(r'\W+',text)
print(result)
# 结果为:['Welcome', 'to', 'CodeId']
参数maxsplit
为最大分割次数,默认是0
表示无限分割。
text = 'Welcome to CodeId'
result =