Python爬虫解析后内容获取:re模块

本文详细介绍了Python爬虫中re模块的使用,包括re.findall()的基本用法和正则匹配常用格式,如^、|、[]、$、.、{}、*、+、?等特殊序列符号的应用。此外,还提到了re.match、re.search、re.compile、re.split、re.sub和re.subu的功能,并讨论了re.S参数的作用。
摘要由CSDN通过智能技术生成

1.re模块

1.re.findall()

1.基本用法

re.findall(正则匹配的格式,匹配的对象)

2.正则匹配常用格式

1.^

只匹配开头在多行模式中匹配每一行的开头

2.a|b

匹配的格式a或者b


推荐Python大牛在线分享技术 扣qun:855408893

领域:web开发,爬虫,数据分析,数据挖掘,人工智能

零基础到项目实战,7天学习上手做项目

3[]
  • [a,b]匹配的格式a或者b如果ab为多个值他会把里面的东西打散

  • [1-9]数字1-9

  • [a-z]字母a-z

  • [A-Z]字母A-Z

  • [^x]内容不等于x

4.$

a$ 匹配已a 结尾的

5..

代表任意字符

6.{}
  • {n}代表大括号前字符n个
  • {n,m}代表大括号前字符n-m个
  • {n,}代表大括号前字符n-多个
  • {+,}代表大括号前字符1-多个
  • {0,}代表大括号前字符0-多个
7.*

代表前面字

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值