python爬虫(三)——re正则表达式库

可以适当翻阅
菜鸟教程
在这里插入图片描述

一 正则表达式的组成

正则表达式一般由字符与操作符组成,其中操作符是我们记忆的重点
在这里插入图片描述
在这里插入图片描述
看到这里学过linux的小伙伴估计就明白了,啊这。。。bash shell似乎也是使用上述表达式完成赋值等操作的耶。
简单示例
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
实际案例
如何匹配网络上的IP地址呢?
将数字分段表示就ok啦~
在这里插入图片描述
所谓难事只不过是简单事情组装起来的东西而已

二 与re库的第一次相遇

ok,了解了正则表达式这个概念之后,疑问来了——如何在python里面表示一个正则表达式呢?或者说我们怎么告诉python编译器我们写的是一个表达式呢?
于是乎,python对正则表达式定义了一个数据类型,这个类型叫做原生字符串所谓原生字符串就是指引号中间没有转义字符英文写作raw String
你只需要在字符串前加一个r就告知python这是一个rawString了
在这里插入图片描述
假如你使用string类型表达正则表达式,那会非常麻烦
在这里插入图片描述
re库常用函数
在这里插入图片描述
1.search方法
在这里插入图片描述
其中String属性是你要经行筛选的素材,而pattern则是你的目标
其中flags的常用值有以下几种,flags是用来修改一些默认值的。
在这里插入图片描述
2.match方法
从String的开始位置开始匹配
在这里插入图片描述
3.findall
返回的是一个列表!!!
4.在这里插入图片描述
在这里插入图片描述
7.finditer
在这里插入图片描述

在这里插入图片描述
8.sub
在这里插入图片描述
上述方法的等价使用方法
在这里插入图片描述
在这里插入图片描述

三 Match对象的深入理解

在这里插入图片描述
其中span返回的是一个元组类型!!!
在这里插入图片描述
请好好参考以下实例
在这里插入图片描述
请注意最后一项是一个二元组!!!不是范围表示!

四 re库贪婪匹配与最小匹配

在这里插入图片描述
在这里插入图片描述
使用?实现最小匹配
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值