七、正则表达式:高级用法search、findall、sub、add、split
1、search搜索的时候没有默认指定开头,搜索到第一个数即以字符串类型返回那个值,不会继续搜索第二个
import re
ret = re.search(r"\d+","阅读数:9999,点赞数:100")
ret.group()
# 结果输出是:"9999"
2、findall可以直接找到所有符合要求的数据,并且返回一个列表
import re
ret = re.findall(r"\d+","阅读数:9999,点赞数:100")
print(ret)
# 结果输出是:["9999","100"]
3、sub可以按照匹配规则,找到所有符合匹配规则的数据,并将其替换,然后返回一个替换后的新数据
sub() 第一个参数是要匹配的规则,第二个参数是要替换后的新数据,第三是被匹配的内容
import re
ret = re.sub(r"\d+", "2000", "阅读数:9999,点赞数:100")
print(ret)
# 输出结果是:"阅读数:2000,点赞数:2000"
4、sub中的add可以利用函数对内容中的数字进行计算
当正则表达式中有add时,会自动调用add函数,修改add函数可以进行不同的计算
# coding = utf-8
import re
def add(temp):
strNum = temp.group()
num = int(strNum) + 1000
return str(num)
ret = re.sub(r"\d+", add,"阅读数:9999,点赞数:100")
print(ret)
# 输出结果是:"阅读数:10999,点赞数:1100"