python爬虫微博数据_python爬虫抓取新浪微博数据

最新推荐文章于 2024-05-01 14:03:39 发布

weixin_39598501

最新推荐文章于 2024-05-01 14:03:39 发布

阅读量457

点赞数 1

文章标签： python爬虫微博数据

需求分析

c4ef31a0ea8c?from=singlemessage

微博主页

抓取的内容包括：微博发布的时间，正文(仅提取文字)，转发数，评论数，点赞数

c4ef31a0ea8c?from=singlemessage

抓取的内容

数据是怎么加载的

新浪微博的数据是用ajax异步下拉加载的，在chrome的调试模式下可捕捉到相应的请求：

c4ef31a0ea8c?from=singlemessage

xhr请求

分析这些url的规律：

https://m.weibo.cn/api/container/getIndex?type=uid&value=1665372775&containerid=1076031665372775&page=2

https://m.weibo.cn/api/container/getIndex?type=uid&value=1665372775&containerid=1076031665372775&page=3

发现除了page参数的不同，其他都是一致的

数据的结构分析

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注