苏生不惑原创文章,加入我的知识星球。
前几天分享过scraper抓取数据 不会写代码怎么办?带你学点真正的黑科技,搞定知乎,b站,豆瓣,抖音,公众号,微博等平台,再分享下抓取知乎文章,回答,想法批量下载导出pdf和excel 。
下载所有知乎回答以渤海小吏的号为例 https://www.zhihu.com/people/dai-zong-66/posts,效果见视频:
导出的excel包含所有知乎回答问题标题和链接。然后用脚本将excel里的回答批量下载:下载的所有回答html内容,文件名为回答日期加标题。接着批量将html转换pdf,效果见网盘https://pan.quark.cn/s/8522433ad346
再将所有pdf合成一个pdf文件:每个回答都有原知乎回答链接。
顺便我还下载了渤海小吏这个公众号的所有文章,包含留言 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数 。
下载所有知乎文章以半佛仙人的号为例 https://www.zhihu.com/people/banfoxianren/posts,效果见视频:
导出的excel数据包含知乎文章标题,链接,评论数和赞同数。然后用脚本将excel里的文章批量下载:下载的所有文章html内容,文件名为回答日期加标题。接着批量将html转换pdf,效果见网盘https://pan.quark.cn/s/8522433ad346
再将所有pdf合成一个pdf文件,每篇文章都有原知乎文章链接:顺便我还下载了半佛仙人这个公众号的所有文章,包含留言。 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数
另外我还写了个批量下载知乎问题下的回答工具,有问题加微信 sushengbuhuo
导出的excel包含每个回答的回答链接,回答作者,回答内容,回答时间和回答更新时间,本来想把回答里的图片也下载了,但是有些回答的图片太多了。
最新原创文章:
再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数
如果文章对你有帮助还请
点赞/在看/分享
三连支持下, 感谢各位!