-
本人爬虫萌新,代码是网上搜了很多示例(很多看不懂,有些也跑不了了),摸摸索索了两天才扒拉下来的,文中代码也非常简单
甚至没有设置headers,如有问题请指正,非常感谢! -
浏览完整代码请直接拖动到底部。
-
工具:Jupyter notebook, Chrome
-
第一步:确定你要爬的是哪条微博的热评,比如这个:
确定了之后我们就进入https://m.weibo.cn/,把这条找出来。
这个时候看它的url,把后面的数字串记住,那是每条微博独有的标识,之后就可以直接带入代码了!
- 第二步:把这个页面的信息扒拉下来
import requests
import json
url = "https://m.weibo.cn/api/comments/show?id=&page=1" #这个地址是个模板,id=后面粘贴上刚才找到的数字串标识
#print(url)
content = reque