python爬虫(正则)4

最新推荐文章于 2023-06-10 20:10:34 发布

gong?

最新推荐文章于 2023-06-10 20:10:34 发布

阅读量87

点赞数

分类专栏： python#爬虫

本文链接：https://blog.csdn.net/gongranr/article/details/104381955

版权

python#爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

re的使用规则

在这里插入图片描述

用正则匹配IP地址（理解如何表达数字的范围）

在这里插入图片描述

re的表示形式

在这里插入图片描述

re.m可以用来匹配一篇文章中的每一行

re.S 设置后换行符也能够匹配

example

search 匹配邮编

match = re.search(r'[1-9]\d{5}','BIT 100081')
if match:
    print(match.group(0))

rematch

import re
match = re.match(r'[1-9]\d','100081 bit')
if match:
    print(match.group(0))

re.findall()

findall 返回的是一个列表

import re
ls = re.findall(r'[1-9]\d','100081 bit 100082')

print(ls)

re.split()

在这里插入图片描述
看下图的输出结果，请仔细理解分割的含义（配到的部分去掉，作为分割的条件）
返回的结果是一个列表

maxsplit 参数的使用

在这里插入图片描述

re.finditer()

返回的是迭代器，每个迭代元素是match对象

import re
it = re.finditer(r'[1-9]\d{5}','BIT100081 TSU100084')
for m in it:
    if m:
        print(m.group(0))

re.sub(替换）

在这里插入图片描述

import re
str = re.sub(r'[1-9]\d{5}',"zipcode",'BIT100081 TSU100084')
print(type(str))
print(str)

re的一种等价使用方法

在这里插入图片描述
###
上面的 regex 才是正则表达式–经过compile后才是正则，

Match 的属性

在这里插入图片描述

Match的方法

在这里插入图片描述

re库的贪婪匹配

在这里插入图片描述

gong?

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python爬虫(正则)4

re的使用规则

用正则匹配IP地址（理解如何表达数字的范围）

re的表示形式

re.m可以用来匹配一篇文章中的每一行

re.S 设置后 换行符也能够匹配

example

search 匹配邮编

rematch

re.findall()

re.split()

maxsplit 参数的使用

re.finditer()

re.sub(替换）

re的一种等价使用方法

Match 的属性

Match的方法

re库的贪婪匹配

re.S 设置后换行符也能够匹配