正则表达式
常用符号:
.:匹配任意字符,换行符\n除外
*:匹配前一个字符0次或无限次
?:匹配前一个字符0次或1次
.*:贪心算法
.*?:非贪心算法
():括号内的数据作为结果返回
. 号的使用
. 就是一个占位符
a = 'xyz123'
b = re.findall('x..',a)
print(b)
---->['xyz']
*号的使用
*号是匹配一次或多次
a='xyxy123'
b= re.findall('x*',a)
print(b)
---->['x', '', 'x', '', '', '', '', '']
因为当匹配到x的时候输出x 当没匹配到x的时候用''占位
?号的使用
?号是匹配一次或0次
a='xy123'
b= re.findall('x?',a)
print(b)
---->['x', '', '', '', '', '']
当它第一次找到了x 往后找不到x 就返回 空的字符
new_link = re.sub(‘pageNum=\d+’,’pageNum=%d’%i,out_url)