Python-使用正则表达式re.S获取html中的图片链接

直接上示例代码

import re

strs='''</li>
            <li class="new-search-works-item">
              <a title="2021高考宣传海报" href="/show/34840284.html"
                target="_blank" class="search-works-thumb relative">
                <img src="http://pic3.ntimg.cn/pic/20210331/3680455_171255068085_4.jpg" alt="2021高考宣传海报">
              </a>
              <div class="search-works-info">
                <a href="/show/34840284.html" class="search-works-name ellipsis" title="2021高考宣传海报">2021高考宣传海报</a>
                      <span class="search-works-price">非商售价:<span>38</span></span>

              </div>
            </li>
            <li class="new-search-works-item">
              <a title="高考加油校园励志海报" href="/show/34843187.html"
                target="_blank" class="search-works-thumb relative">
                <img src="http://pic3.ntimg.cn/pic/20210401/24611550_080435886108_4.jpg" alt="高考加油校园励志海报">
              </a>
              <div class="search-works-info">
                <a href="/show/34843187.html" class="search-works-name ellipsis" title="高考加油校园励志海报">高考加油校园励志海报</a>
                      <span class="search-works-price">非商售价:<span>40</span></span>

              </div>
            </li>'''

strs=re.findall('img src="(.*?)"', strs,re.S)

print(strs)

如上一段html代码,是我随便找了个图片网站复制的,现在是要取出源码中的两个jpg图片的链接,使用正则re.S轻松搞定,而且输出结果为列表

['http://pic3.ntimg.cn/pic/20210331/3680455_171255068085_4.jpg', 'http://pic3.ntimg.cn/pic/20210401/24611550_080435886108_4.jpg']

正则中,(.*?) 正则匹配的是图片链接,img src=" 是图片链接前面的字符," 是链接后面的字符。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

tsfy2003

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值