python爬取微博评论超100页_python爬取新浪微博评论-Go语言中文社区

最新推荐文章于 2024-04-06 19:25:15 发布

weixin_39992831

最新推荐文章于 2024-04-06 19:25:15 发布

阅读量1.4k

点赞数

文章标签： python爬取微博评论超100页

简介

爬取微博m站评论。由于api限制只能爬取前100页，如果想要更全数据需爬pc端。

工具

python 3.5

requests库

re库

步骤

1. 登陆保存cookie

首先，打开m.weibo.cn. 输入用户名密码登陆之后，打开chrome开发者工具(Developer Tool)，在Network里面找到m.weibo.cn这个地址，把cookie保存下来。

2. 找翻页规律

如图所示，利用开发者工具找到“show?id=...”，第一行的url就是要请求的地址。

多翻两页就会发现，“https://m.weibo.cn/api/comments/show?id=4073157046629802”这一串是不变的，只有后面的“page=”随翻页而变化。

我用的是.format()指令来实现url变化。

3. 写代码

上面两步完成后，接下来就可以写爬虫了。

(1)设置headers

为了不让网站发现我们是爬虫，需要设置user-agent和cookie，代码如下：headers = {'Cookies':'Your cookie',

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chro

最低0.47元/天解锁文章

weixin_39992831

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python爬取微博评论超100页_python爬取新浪微博评论-Go语言中文社区

简介爬取微博m站评论。由于api限制只能爬取前100页，如果想要更全数据需爬pc端。工具python 3.5requests库re库步骤1. 登陆保存cookie首先，打开m.weibo.cn. 输入用户名密码登陆之后，打开chrome开发者工具(Developer Tool)，在Network里面找到m.weibo.cn这个地址，把cookie保存下来。2. 找翻页规律如图所示，利用开发者工具找...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。