新浪微博爬虫（无需模拟登陆）

最新推荐文章于 2024-08-09 08:06:10 发布

置顶

Nick12138_2017

最新推荐文章于 2024-08-09 08:06:10 发布

阅读量7.8k

点赞数

分类专栏： 1 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Nick12138_2017/article/details/79363170

版权

本文介绍了使用Python进行新浪微博爬虫的步骤，无需模拟登录。通过Chrome浏览器的开发者模式观察网络请求，找到XHR请求，解析JSON数据获取微博内容和图片URL，从而实现微博的抓取和下载。

摘要由CSDN通过智能技术生成

环境：
浏览器： chrome 64
python 3.6

ps：python新手，写得不好求轻喷
ps：这是更加纯净的微博内容页面
思路步骤：

打开微博移动端网址并登录，
如
找到目标人物的微博，并按F12打开开发者模式，找到Network选项卡，勾选preserve log，类型选择XHR，下拉页面直至加载下一页，发现XHR中多了几项文件，打开图中的URL，如图
复制响应页面的内容，并用在线json工具解析可得

设该json为r，cards=r[‘data’][‘cards’]为微博列表，对cards中的每一个card，图片信息pics_info在card[‘mblog’][‘pics’]，以此类推，获取到图片的URL之后就可以下载了

附上代码：

from

最低0.47元/天解锁文章

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。