微博高清图片爬取

本文介绍了如何使用Python爬虫获取微博的高清图片。通过利用微博相册中的cookie,可以访问到图片信息。在xhr分支中找到包含popview的链接,获取图片列表,从中解析出mid和pid,构造原图URL。具体实现中,注意到列表的最后一个图片可能与下一次请求的第一个图片重复,需要适当处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用到的库

requests,json

由于高清图需要登陆浏览,所以需要cookie

根据我的测试,cookie只需要一项,就是sub=。。。。。。。。那一项,

具体操作

首先,打开微博,搜索你想下载图片的博主,然后点击他的相册,调出调试模式,然后点击一下第一张图片,在右方network选项的xhr分支里面会加载几个新出现的对象。
在这里插入图片描述
我们打开带有popview字样的链接,发现其内容为图片列表,含有大约二十个图片的关键信息

在这里插入图片描述
然后我们点击图片的右上角有一个查看原图:
在这里插入图片描述
发现原图的格式为“https://photo.weibo.com/1350995007/wbphotos/large/mid/4614978633990921/pid/001tqDw3ly1gokg1s68w7j61rv2gcu0x02”
后面的mid与pid就在我们刚才介绍的图片列表里面。

具体代码

<
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值