Django31——使用正则表达式提取景点内容中的所有图片


如何提取景点信息内容中的所有图片呢?

1、使用re.findall('<img src="(.*?)"/>', str1, re.S)

import re
str1 = '<p>熊猫基地位于四川省成都市</p><p><img src="/media/upload/2022/05/26/4a44d601-63d7-4c8d-9759-a6d569a58ef6.png"/>'
result = re.findall('<img src="(.*?)"/>',str1,re.S)
print(result) 

结果为:

['/media/upload/2022/05/26/4a44d601-63d7-4c8d-9759-a6d569a58ef6.png']

注意,imgsrc之间不能有其他内容,并且是"/>"/>没有空格。

**如果没有匹配的内容,则返回空列表。**如下所示:

str2 = '<p>朱德纪念馆位于四川省泸州市况场镇</p><p>很有纪念意义,值得参观</p><p>&nbsp;</p>'
result = re.findall('<img src="(.*?)"/>',str2,re.S)
print(result)  #[]

在这里插入图片描述

2、使用 re.findall(‘src=“(.*?)”’,str3,re.S)

如果img标签和src属性之间还有其他属性, 则你也可以直接取src, 如:

str3 = '<p>熊猫基地位于四川省成都市</p><p><img alt="" src="/media/upload/2022/05/26/4a44d601-63d7-4c8d-9759-a6d569a58ef6.png" style="height:533px; width:800px" /></p><p>憨憨厚厚的熊猫</p><p><img alt="" src="/media/upload/2022/05/26/4b3c2c17-8e0b-42f2-a660-bd9e01ba2be2.jpg" style="height:452px; width:680px" /></p><p>&nbsp;</p>'
result = re.findall('src="(.*?)"',str3,re.S)
print(result)

结果如下:

['/media/upload/2022/05/26/4a44d601-63d7-4c8d-9759-a6d569a58ef6.png', '/media/upload/2022/05/26/4b3c2c17-8e0b-42f2-a660-bd9e01ba2be2.jpg']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值