爬虫 re模块和正则表达式

可以用来规定爬取字段的特定标准的文字,影评,电话啥的

最全常用正则表达式大全_ZhaoYingChao88的博客-CSDN博客_常用正则表达式一、校验数字的表达式1. 数字:^[0-9]*$2. n位的数字:^\d{n}$3. 至少n位的数字:^\d{n,}$4. m-n位的数字:^\d{m,n}$5. 零和非零开头的数字:^(0|[1-9][0-9]*)$6. 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$7. 带1-2位小数的正数或负数:^(\-)?\d...https://blog.csdn.net/ZYC88888/article/details/98479629

 

import re
# 创建模式对象

pat = re.compile("AA") # 此出的AA,是正则表达式,用来去验证其他的字符串
m = pat.search("CBA")   #search字符串被校验的内容

m = pat.search("ABCAA")
m = pat.search("AABCAADDCCAAA")    #search方法,进行比对查找

#没有模式对象
m = re.search("asd","Aasd")     #前面的字符串是规则(模板),后面的字符串是被校验的对象
print(m)


print(re.findall("a","ASDaDFGAa"))      #前面字符串是规则(正则表达式),后面字符串是被校验的字符串

print(re.findall("[A-Z]","ASDaDFGAa"))

print(re.findall("[A-Z]+","ASDaDFGAa"))


#sub

print(re.sub("a","A","abcdcasd"))   #找到a用A替换,在第三个字符串中查找"A"

#建议在正则表达式中,被比较的字符串前面加上r,不用担心转义字符的问题
a = r"\aabd-\'"
print(a)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值