1.re.findall
搜索字符串,以列表形式返回全部能匹配的子串,返回形式为数组
findall(pattern, string, flags=0)
第一个参数,正则表达式
第二个参数,搜索的是哪些字符串
第三个参数,匹配的模式,其中re.S使匹配包括换行在内的所有字符。findall()函数是逐行匹配的。
返回string中所有与pattern相匹配的全部字串,返回形式为数组
re.S:有时候我们在爬虫的时候会见到这个参数,使 . 匹配包括换行在内的所有字符
re.I:使匹配对大小写不敏感
re.L:做本地化识别(locale-aware)匹配
re.M:多行匹配,影响 ^ 和 $
re.U:根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X:该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
2.常见匹配模式
在线生成正则表达式代码的网址:
https://c.runoob.com/front-end/854