爬虫学习笔记 -- 正则表达式

0x01 match

1、从头开始匹配,只能匹配一次

import re
str="1a2b3c456d7e890f"
res=re.match('\d+',str)
print(res.group())
运行结果:1

2、通用匹配符.*?

import re
str="11a2b3c456d7e890f"
res=re.match('11a(.*?)d',str)
print(res)
运行结果:11a2b3c456d

3、常用匹配规则

\d               0到9的任何数字


\D               除0到9的数字以外的任何字符


\w               任何字母、数字或下划线(单词)


\W               除字母、数字和下划线以外的任何字符


\s               空格、制表符或换行符(空白)


\S               除空格、制表符和换行符以外的任何字符


?                            匹配零次或一次前面的分组


*                            匹配零次或多次前面的分组


+                            匹配一次或多次前面的分组


|                            匹配多个表达式中的一个


()                           使用括号创建"分组"


{n}                          匹配n次前面的分组


{n,}                         匹配n次或更多前面的分组


{,m}                         匹配零次到m次前面的分组


{n,m}                        匹配至少n次、至多m次前面的分组


{n,m}?或*?或+?               对前面的分组进行非贪心匹配


^spam                        字符串必须以spam开始


spam$                        字符串必须以spam结束


.                            匹配所有字符,换行符除外


\d、\w和\s                   匹配数字、单词和空格


\D、\W和\S                   匹配出数字、单词和空格外的所有字符


[abc]                        匹配方括号内的任何字符


[^abc]                       匹配不在方括号内的任何字符

0x02 search

1、任意位置开始匹配,返回第一个匹配结果

import re
str="11a2b3c456d7e890f"
res=re.search('5(.*?)d',str)
print(res.group())
运行结果:56d

0x03 findall

1、获取匹配的所有结果

import re
str="11a2b3c456d7e890f"
res=re.findall('\d{3}',str)
print(res)
运行结果: ['456', '890']

0x04 sub

1、替换匹配到的内容,将字母全部替换

import re
str="11a2b3c456d7e890f"
res=re.sub('\D','',str)
print(res)
运行结果:11234567890

0x05 compile

1、可以将正则表达式多次利用,不用重复书写

import re
str="11a2b3c456d7e890f"
str1="11a2b3c456d7e890f"
pp=re.compile('\D')
res=re.sub(pp,'',str)
res1=re.sub(pp,'',str1)
print(res,res1)
运行结果:11234567890 11234567890

0x06 声明

仅供安全研究与学习之用,若将工具做其他用途,由使用者承担全部法律及连带责任,作者不承担任何法律及连带责任。

欢迎关注公众号编程者吧

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

web安全工具库

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值