re模块

最新推荐文章于 2023-12-03 21:43:38 发布

孤城炎

最新推荐文章于 2023-12-03 21:43:38 发布

阅读量133

点赞数 1

分类专栏：爬虫正则表达式

本文链接：https://blog.csdn.net/weixin_46056679/article/details/104302042

版权

6 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

import re

pattern = re.compile(
    r'正则表达式',	# r表示按原样输出
    '匹配模式',		# 可以不指定
	)

正则匹配模式：

re.S	# 可以匹配换行符
re.I	# 忽略大小写

使用方法:

match = pattern.match(	# match, search, findall, finditer
    string,	# 匹配的目标字符串
    start,	# 匹配目标字符串的起始位置（可选）
    end		# 匹配目标字符串的结束位置（可选）
	)

默认从头开始匹配, 只匹配一次

全文匹配, 匹配多次,将第一次匹配成功的数据返回

match.group()	# == match.group(0)		返回匹配结果内容
match.span()	# 匹配范围
match.start()	# 匹配起始位置
match.end()		# 匹配结束位置

全文匹配, 匹配多次,将匹配成功的所有数据返回,返回对象是一个列表

全文匹配, 匹配多次, 返回一个迭代器, 迭代器里面存储的是match对象

按正则方法表示内容进行分割字符串, 返回分割后的list

pattern.split(
    String,		# 需要分割的字符串
    Maxsplit	# 指定最大分隔次数,默认全部分隔,可选
)

按照正则表示的内容替换字符串, 返回替换后的字符串

Pattern.sub(
    repl， 	# 替换为
    String,	# 需要替换的对象字符串
    Count	# 替换次数,可选,默认全部替换
)

关注

专栏目录