【转】爬虫常用正则、re.findall 使用

爬虫常用正则

爬虫经常用到的一些正则,这可以帮助我们更好地处理字符。

正则符

单字符

. : 除换行以外所有字符
[][aoe] [a-w] 匹配集合中任意一个字符
\d :数字  [0-9]
\D : 非数字
\w :数字、字母、下划线、中文
\W : 非\w
\s :所有的空白字符包,括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]
\S : 非空白

数量修饰

* : 任意多次  >=0
+ : 至少1>=1
? : 可有可无  0次或者1{m} :固定m次 hello{3,}
{m,} :至少m次
{m,n} :m-n次

边界

$ : 以某某结尾 
^ : 以某某开头

分组

(ab)

贪婪模式

.*

非贪婪惰性模式

.*?

案例题
re.findall 使用
1、re.findall 可以对多行进行匹配,并依据参数作出不同结果。

re.findall(取值,值,re.M)
- re.M :多行匹配
- re.S :单行匹配 如果分行则显示/n
- re.I : 忽略大小写
- re.sub(正则表达式, 替换内容, 字符串)

转自:https://www.cnblogs.com/xiangsikai/p/11251620.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值