打开微博官网,这里以爬取美女博主Duebass的所有图片为例,首先打开她的主页

主页中显示的都是一些小图,我们点击其中的某一张图片,就可以查看她的大图了。

打开F12查看图片的地址信息,
![]()
//wx4.sinaimg.cn/mw690/75614297ly1g2sq66raswj21vl2qae82.jpg
复制这个地址去源代码中搜索,我们发现搜索不到这个url,那么狠明显,图片的地址信息是存放在js或者json文件中的。由于电脑端查看的信息不是很完整,这里我们使用手机端的模式来查看。点击左上角的手机图标然后刷新页面就可以切换到手机浏览模式

切换到手机视图之后,我们再打开Network这个选项,刷新页面信息&#x

本文介绍了如何使用Python爬虫从微博博主Duebass的主页获取高清美女图片。通过分析网页结构,发现图片URL隐藏在JS或JSON文件中,特别是在手机模式下。找到以getIndex命名的文件,从中提取大图地址,同时确定分页规则,通过遍历不同页码抓取所有图片。在抓取过程中,需处理可能出现的异常情况,如计算机拒绝访问。
最低0.47元/天 解锁文章

2285

被折叠的 条评论
为什么被折叠?



