01前言
微博数据爬取价值
① 社会公共事件舆论分析 通过公共事件的 ‘关键词’ 词汇,如“肺炎、口罩、武汉、地震”等等,获取全平台热门微博,从中分析事件发展轨迹、舆论焦点、挖掘消息来源、识别中心传播者/机构以及风险预警通知
② 时事热点追踪、信息源获取 采集汇总微博各大官方权威机构发布的 公告通知、最新最热的时事事件、焦点人物动态跟踪 等
02.爬取新浪微博关键字博文
2.1 寻找搜素关键字接口
2.2 请求接口解析数据
注意需要携带cookies
2.3 解析每篇博客mid,以及博文链接
正则从博文链接中取出博文标识
2.4 请求单篇博文接口
代码如下 提取每篇博文信息
2.5 寻找每篇博文评论接口
获取评论信息
注意每次评论翻页需携带上一页返回max_id
存入csv
3. 0 运行程序结束
学习爬虫小伙伴赶紧试一下
实践出真知
需要源代码可以私信我