Python 正则表达式之re.search()
昨天和大家分享了正则表达式中的 re.match() 函数,简而言之,该函数需要从字符串的开始匹配,若不符合正则表达式,则认为不匹配,返回None。
今天和大家分享另外一个函数re.search(),该函数扫描整个字符串并返回第一个成功的匹配。
re.search
函数语法:
re.search(pattern, string, flags=0)
函数参数说明:
pattern 匹配的正则表达式 string 要匹配的字符串。 flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 可选标志(flags):
re.I 使匹配对大小写不敏感 re.L 做本地化识别(locale-aware)匹配 re.M 多行匹配,影响 ^ 和 $ re.S 使 . 匹配包括换行在内的所有字符 re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。 当函数匹配成功时,re.search()方法返回第一个匹配的对象,否则返回None。
我们仍然可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。其使用方法如下:
group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。 groups() 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。 实例:
import re line = "Dog is the best friend of humans" searchObj = re.search(r'(.*) is (.*?) .*', line, re.M | re.I) if searchObj : print("searchObj.group():", searchObj.group()) print("searchObj.group(1):", searchObj.group(1)) print("searchObj.group(2):", searchObj.group(2)) else: print("Nothing found !!")
有的小伙伴们可能会觉得这期的 re.search() 与上期的 re.match() 函数感觉没有 什么不同呀,都是能够正常找到匹配的对象,那么你就错了,接下来让小编来告诉小伙伴们这两者之间有何不同吧。
Here we go.
<( ̄︶ ̄)↗[GO!]
re.match() 与 re.search() 的区别
- re.match() 方法只匹配字符串的开始,如果字符串的开始就不符合正则表达式,那么很遗憾的告诉你,匹配失败,将会返回 None
- re.search() 方法匹配整个字符串,直到找到一个与正则表达式匹配
这样说了,有些小伙伴们可能还是会有疑惑,不用担心,实例解君愁:
import re line = "Dog is the best friend of humans" matchObj = re.match( r'best', line, re.M|re.I) if matchObj: print("match --> matchObj.group() : ", matchObj.group()) else: print ("No match!!") searchObj = re.search( r'best', line, re.M|re.I) if searchObj: print("search --> searchObj.group() : ", searchObj.group()) else: print ("No match!!")
更多有趣、有料,请关注公众号