下面的代码,可以爬取单个知乎用户的所有回答数据,并保存到表格中。
数据包括回答的问题标题,回答的url,回答的内容文本,获赞数,发布时间及数据采集时间。
爬虫的功能分为以下4个部分:
- 采用 selenium 启动无头浏览器
- 爬取用户回答列表页的标题与url
- 爬取每个回答的内容、发布时间与获赞数
- 把爬取到的数据用表格文件保存
代码有哪里看不懂的,在评论里留言,我会抽空解答。
"""采用 python selenium 无头浏览器,爬取单个用户的所有回答数据并保存为表格文件。"""
这个脚本适合备份自己的回答数据。
如果你的回答列表页有很多页,代码该怎么写?你可以试试看,改进它很容易。自己实在搞不懂那就在评论区留言,我有空会解答。
下面是我的代码执行结果截图:
![edd7b29da1a507faeeff749d9201f938.png](https://i-blog.csdnimg.cn/blog_migrate/3a06512363184e25e76266f157516593.jpeg)
齐活。