Python网络爬虫与提取--网络爬虫之正则表达式[Re库]【嵩天】

本文介绍了Python中用于正则表达式的Re库,包括正则表达式的语法、Re库的主要函数如search、match、findall、split、finditer和sub,以及Match对象和贪婪匹配与最小匹配的概念。通过实例解析了如何使用Re库进行字符串匹配和操作。
摘要由CSDN通过智能技术生成

正则表达式:一种通用的字符串表达框架

编译:p = re.compile(regex),将符合正则表达式语法的字符串regex转换成正则表达式特征p

3.1 正则表达式的语法(操作符)

3.2 Re库

import re

3.2.1 正则表达式的表示类型

re库采用raw string类型(原生字符串类型)r'text'表示正则表达式, 也可用字符串直接表示,但是含有转义字符时建议用raw string类型表示。

3.2.2 Re库的主要功能函数

re.search(pattern, string, flags=0):

pattern: 正则表达式的字符串或原生字符串表示

string: 待匹配的字符串

flags=0: 正则表达式使用时的控制标记

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值