python爬虫——re库

本文介绍了Python的re库,包括正则表达式的原始字符串类型,re库的主要功能函数如search(), match(), findall(), split(), finditer()和sub()的用法。还讨论了re库的贪婪匹配和最小匹配原则,并提到了Match对象的应用。" 54311802,5817743,SharePoint 2013 完整部署指南,"['SharePoint', '服务器部署', '企业应用', '软件安装', '系统集成']
摘要由CSDN通过智能技术生成

正则表达式的表达类型

raw string类型(原生字符串类型):不包含对转义字符再次转义的字符串
而re库应尽量采用此类型表示正则表达式
r’text’

Re库的主要功能函数

re.search()

Re.search():在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象
格式:

re.search(pattern,string,flags=0)

pattern:正则表达式的字符串或原生字符串表示
string:待匹配字符串
flags:正则表达式使用的控制标记

>>> import re
>>>> match=re.search(r'[1-9]\d{5}','bit 100081')
>>> if match:
	print(match.group(0))

100081
>>> match.goup(0)
Traceback (most recent call last):
  File "<pyshell#8>", line 1, in <module>
    match.goup(0)
AttributeError: '_sre.SRE_Match' object has no attribute 'goup'

此外,我们审查类型

>>> type(match
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值