python的re模块


写在前面:以前有想要学爬虫,没有坚持学习下来,现在用re模比较多,于是系统学一下,顺便记录下来,提高使用re模块的效率

re模块

1、基本结构

import re

pattern = r''
#原生字符串模式
#也可以用下面的定义模式
pattern = re.compile('正则表达式')
string = ''

re.match(pattern, string, flag)

2、常用函数

2.1、match函数

re.match(pattern, string, flag)

用法:在字符串开头匹配,匹配到就结束

匹配成功返回一个对象,要想返回具体字符串,用group()
失败发挥一个none

2.2、search函数

与match基本相同,不过是在任意位置匹配

2.3、findall函数

re.findall(pattern, string, flag)

找到匹配分组里所有字符串,返回的是一个列表

2.4、sub函数

re.sub(pattern, target, string, flag)

pattern 要被替换的字符串
target 要替换成的字符串

2.5、group函数与groups函数

  • m.group(N) 返回第几组括号匹配的字符串
  • m.group() == m.group(0) 返回所有匹配的字符,与括号无关
  • m.groups() 返回所有括号匹配的字符,返回的类型是一个元组 m.groups() = (m.group(0), m.group(1), ……)

3、一些要注意的

  • 用search、match匹配返回的是一个对象,要用group分组,显示出来
  • r 原生字符串和re.complile是等价的
  • findall遇到括号嵌套的问题,原则是从左到右,从外到内
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值