1、search():
search()方法在匹配时,会把整个字符串进行扫描,然后返回匹配成功的结果。就是说,正则表达式只是被扫描的字符串的一部分时,search()方法还是会扫描目标字符串,当找到符合规则的字符串时,就会返回匹配内容,如果找不到就会返回None。
2、findall():与search相比,search()方法找到的是匹配正则表达式的第一个内容,但是findall()方法可以获取匹配正则表达式的所有内容,他会搜索整个字符串,然后将匹配的正则表达式返回。返回类型为列表,列表内的元素都为元祖类型。
3、sub():
sub()使用来修改文本的,比如想要去掉信息中的数字,就可以借助sub()方法,如:re.sub(’\d+’,’’,content),第一个参数是为了匹配所有的数字,第二个参数为替换成的字符串,去掉的话将赋值为空,第三个参数是原来的字符串。
4、compile():
compile()方法是将正则字符串编译成正则表达式对象,以便在后面的匹配中使用,一般都会与前面的三个方法一起使用
爬虫中search findall sub 以及complile的总结
最新推荐文章于 2021-08-08 17:57:18 发布