正则表达式re库学习笔记

import re
content = 'Hello 123 4567 World_This is a Demo'

泛匹配

# result = re.match('^Hello\s\d',content)
# print(result)
# print(result.group())
#
# result1 = re.match('^Hello(.*)mo$',content)
# print(result1.group(1))
#group(1) 匹配第一个小括号里面的(.*)

贪婪匹配

# .* 匹配尽可能多的
#非贪婪匹配
# .*?
# result1 = re.match('^Hello.*?(\d+).*mo$',content)
# print(result1.group(1))

转义

# content1 = 'price is $5.00'
# r = re.match('price is \$5\.00', content1)
# print(r)

search方法

html = '''
<span title="上传时间" class="so-icon time"><i class="icon-date"></i>
          2018-03-12
        </span>
        <span title="up主" class="so-icon">
        <i class="icon-uper">
        </i>
        <a href="//space.bilibili.com/50329118?from=search&amp;seid=4013545761942438181" target="_blank" class="up-name">
        bilibili英雄联盟赛事</a></span>
        </span><span title="up主" class="so-icon"><i class="icon-uper"></i><a href="//space.bilibili.com/111369485?from=search&amp;seid=4013545761942438181" target="_blank" class="up-name">GENJI丶虚无</a></span></div></div></li><li class="video matrix"><a href="http://www.bilibili.com/video/av20564642?from=search&amp;seid=4013545761942438181" target="_blank" title="[LPL春季赛]3月9日 IG vs BLG"><div class="img"><div class="lazy-img"><img alt="" src="//i0.hdslb.com/bfs/archive/3972fa1be2d1329483b80ef46cf92ecc16236e53.jpg@400w_250h.webp"></div><span class="so-imgTag_rb">
          02:17:54
        </span><div class="watch-later-trigger watch-later"></div></div></a><div class="info"><div class="headline clearfix"><span class="type avid">av20564642</span><span class="type hide">电子竞技</span><a title="[LPL春季赛]3月9日 IG vs BLG" href="http://www.bilibili.com/video/av20564642?from=search&amp;seid=4013545761942438181" target="_blank" class="title">[<em class="keyword">LPL</em>春季赛]3月9日 IG vs BLG</a></div><div class="des hide">
        相关游戏: 英雄联盟
简介补充: [LPL春季赛]3月9日 IG vs BLG
      </div><div class="tags"><span title="观看" class="so-icon watch-num"><i class="icon-playtime"></i>
          14.5万
        </span><span title="弹幕" class="so-icon hide"><i class="icon-subtitle"></i>
          5045
        </span><span title="上传时间" class="so-icon time"><i class="icon-date"></i>
 '''

r = re.findall('<a\shref="(.*?)\starget="_blank"\sclass="up-name">(.*?)</a></span>', html, re.S)


for i in r:
    print(i)
    print('--------')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值