最近打比赛用到了正则表达式,于是就总结了一些。
常用的有三种
1.re.match 从开头匹配
2.re.search 搜索整个字符串f返回第一个子串
3.re.findall 搜索整个字符串中所有满足的字符串,返回列表
首先看一下re.findall
re.findall('\d_\d+\.jpg', '3_58.jpg')
# ['3_58.jpg']
re.findall('\d_\d+\.jpg', '358.jpg')
# []
re.findall('\d_\d+\.jpg', '13_58.jpg2')
['3_58.jpg']
re.findall('^\d_\d+\.jpg$', '13_58.jpg2') # ^开头 $ 结尾
# []
.*
贪婪模式 (匹配尽可能多的)
.*?
非贪婪模式 (匹配尽可能少的字符)
n = re.match('123.*123', '123456123789123')
# 123456123789123
n = re.match('123.*?123', '123456123789123')
# 123456123
group
- group() 同group(0)就是匹配正则表达式整体结果
- group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。
n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(2)
# '有机质≥15%'
n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(1)
# '总养分≥31%(16-5-10),'
n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(3)
# ' ,含氯(中氯)'
正则表达式中的三组括号把匹配结果分成三组