程序员教你通过获取api爬取新浪微博内容数据实战

最新推荐文章于 2024-09-26 17:30:41 发布

不许赖zhang

最新推荐文章于 2024-09-26 17:30:41 发布

阅读量5.4w

点赞数 4

一、回顾

我们之前利用Scrapy爬取豆瓣网站信息时，直接通过加载目标URL返回的Response得到想要的值。我也在后面爬取知乎网站时通过模拟登录的方式进入到目标URL，也是通过返回的Response得到需要的值。

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

这一次，我们将通过解析网站的HTTP请求去破解获取数据的API的方式去爬取想要的数据。

二、找出微博用户唯一标示：oid

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

三、找出微博用户的微博内容api

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

我们发现在获取下一页数据时的api加了一个值为2的参数page。继续往下翻页，page变成3、4、5...，由此我们推断这个api获取哪一页的数据由page决定。

四、分析返回的json格式的微博内容

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

五、获取微博内容的代码实现

我们分析完接口之后就可以开始编写爬虫代码。此处附上完整代码。

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

运行结果为：

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

25K的程序员教你通过获取api爬取新浪微博内容数据实战！附源码！

关注

4
点赞
踩
60

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。