1、寻找数据链接
- 继续向下滑动,寻找数据变化规律,只有max_id参数发生了变化,判断这个是获取页数的意思。
2、分析数据
点开预览发现有我们需要的数据,使用requests模块获取数据数据进行解析。
- 打印返回的response并转化为json字符串
3、存储数据
info = {}
for item in items:
info["发布日期"] = item["created_at"]
info["发布者"] = item["user"]["screen_name"]
info["简介"] = pq(item["text_raw"]).text()
with open("./files/微博数据.txt", "a", encoding="utf-8") as f:
f.write(str(info) + "\n")