Python爬虫】数据解析:re正则

  • 字符的表示

    • .任意一个字符,除了换行
    • [a-f][A-D][0-9][bgj]范围内的任意一个字符
    • \w 字母、数组和下划线组成的任意字符
    • \W
    • \d 数字
    • \D 非数字
    • \s 空白
    • \S 非空白
  • 量词(数量)的表示

    • * 0或多个
    • + 1或多个
    • ? 0或1个
    • {n} n个
    • {n,} 至少n个
    • {n,m} n~m个
  • 分组表示

    • ( ) 普通的分组表示,多个正则分组时,search()、groups()返回是元组
    • (?P<name> 字符+数量) 带有名称的分组,多个正则分组时,search()、groupdict()返回是字典,字典的key即是分组名。
  • Python中的正则模块

    • re.compile()一次生成正则对象,可以多次匹配查询

    • re.match(正则对象,字符串)

    • re.search()

      text = '1231bc90xx'
      re.sub('\d+', '120', text)	#将text中的所有数字替换成'120'
      #输出 '120bc120xx'
      
    • re.findall()

    • re.sub() 替换

    • re.split()

问题
  • compile() / match() / search() 三者之间的区别
  • search() / findall() 区别
  • 贪婪模式和非贪婪模式
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值