1.正则表达式:匹配字符串内容的一种规则。
- 正则表达式中常用的字符含义,参考链接:https://www.cnblogs.com/tina-python/p/5508402.html
- 推荐一个正则表达式在线测试的网址:http://tool.chinaz.com/regex
2.re模块就是python用来做正则匹配的模块,下面介绍re模块常用的方法:
1.re.findall()
import re
#[a-z]+,匹配a-z中的字母,+:贪婪匹配(匹配前一个字符1次或无限次)
ret =re.findall('[a-z]+','eva egon yuan')
print (ret)#以列表形式返回值
[‘eva’, ‘egon’, ‘yuan’]
2.re.search()
- 从前往后,找到一个就返回,返回的变量要用group才能拿到结果,如果没有找到,返回None,条用group会报错。
ret = re.search('a','eva egon yuan')
if ret:
print (ret.group())
a
3.re.match()
- match是从头开始匹配,如果正则规则从头开始可以匹配上,就返回一个变量。匹配的内用需要用group才能显示,如果没有匹配上会报错。
ret = re.match('e','eva egon yuan')
if ret:
print (ret.group())
e
4.re.split()
#先按'a'分割,得到['','bcd'],然后对上面的结果按b分割,得到['','','cd']
ret = re.split('[ab]','abcd')
print (ret)
[’’, ‘’, ‘cd’]
5.re.sub()
#将数字替换成'H',参数2表示前2个数字,默认所有
ret = re.sub('\d','H','eva3egon4yuan4',2)
print (ret)
evaHegonHyuan4
6.re.subn()
#将数字替换成'H',并返回替换次数,以元组形式返回
ret = re.subn('\d','H','eva3egon4yuan4')
print (ret)
(‘evaHegonHyuanH’, 3)
7.re.compile()
obj = re.compile('\d{3}')
#将正则表达式编译成一个,正则表达式对象,规则匹配的是3个数字
ret = obj.search('abc123eee')
print (ret.group())
123
8.re.finditer()
#返回一个储存匹配结果的迭代器
ret = re.finditer('\d','ds3sy47825a')
print (ret)
print (next(ret).group())
print (next(ret).group())
print ([i.group() for i in ret])
<callable_iterator object at 0x00000288B5A420B8>
3
4
[‘7’, ‘8’, ‘2’, ‘5’]
参考链接:https://www.runoob.com/python3/python3-reg-expressions.html