Python基础自学实用笔记 (九):32.正则表达式(爬虫必修)

**

32.正则表达式(爬虫必修)

**
使用re模块

***group()方法的使用
在这里插入图片描述
***编译标志
在这里插入图片描述
在这里插入图片描述

***模式对象
temp = re.compile(r’[a-z]’)
temp.findall(‘ha123ha’)

1—re.seach(r’规则’,”文本”)
r表示原始字符串
点号可用代表任何符号(除\)
. 表示( . )本身
\d表示任何数字
\数 表示重复;\三位数 表示八进制字符
在这里插入图片描述
$ 和 \Z 表示结尾
^ 和 \A 表示开头
在这里插入图片描述
在这里插入图片描述
[ ]表示内部都为字符,除一些特殊字符(- \ ^)
{ }表示前个字母重复次数(可为0),内部可用是个范围
在这里插入图片描述
-表示范围
在这里插入图片描述

例:(查找0-255的数)
在这里插入图片描述
分析:000-199 或 200-249 或250-255

2---findall(r’规则’,”文本”)
找到符合条件的输出列表
例:
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200610001411880.png)

[ ] 内^放在最前表示取反,最后表是本身,例:
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200610001447628.png)



+表示匹配子表达式一次或多次
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200610001513834.png)
*表示匹配子表达式零次或多次
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200610001529980.png)
? 表示匹配子表达式零次或一次

默认在符合条件下尽可能多匹配,用?可限制一次

在这里插入图片描述

\s 表示空白字符(\t \n \r \f \v)
\w 表示单词字符(汉字、字母、数字、下划线)

在这里插入图片描述

其他  \字符  见表!
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值