正则表达式

补充关于爬虫中.*?

1、. 匹配任意除换行符“\n”外的字符;
2、*表示匹配前一个字符0次或无限次;
3、+或*后跟?表示非贪婪匹配,即尽可能少的匹配,如*?重复任意次,但尽可能少重复;
4、 .*? 表示匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
如:a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。

-------------------------------------------------------------------------------------------------------------------------------------------------------

*:匹配前面字符的任意次数(包括0次)       不常用

+:匹配前面字符的任意次数(不包括0次)    常用

{}:指定前面字符出现次数   eg:[a-z]{2,10}  字母出现2-10次

[]:表达任选一种  eg:[a-z0-9]  字母或者数字开头

?:控制为非贪婪模式

\d:数字

\D:非数字

\s:空白字符

\S:非空白字符

\w:任意文字字符

\W:任意非文字字符

^:[]中使用表达 非

     不在[]中使用表达文本开头 或每行开头(多行模式)

$:表达结尾

import re
file='I have 2334 apples,0 orange and 44566 bananas.'
x=re.findall(r'[0-9]+',file)
print(x)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值