2024批量下载知乎回答/文章/想法/专栏/视频,公众号文章内容/话题/图片/封面/视频/音频,微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024写个脚本下载知乎回答/文章/想法/专栏/视频,公众号文章内容/话题/图片/封面/视频/音频,微博内容/图片/视频/评论/转发数据,导出excel和pdf。

下载所有知乎回答以渤海小吏的号为例,抓取的知乎回答excel数据包含所有知乎回答问题标题和链接。

然后用脚本将excel里的回答批量下载:

下载的所有回答html内容,文件名为回答日期加标题。

接着批量将html转换pdf。再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf

再将所有pdf合成一个pdf文件:

下载所有知乎文章以半佛仙人的号为例,导出的excel数据包含知乎文章标题,链接,评论数和赞同数。

然后用脚本将excel里的文章批量下载:

下载的所有文章html内容,文件名为回答日期加标题。

接着批量将html转换pdf

再将所有pdf合成一个pdf文件,每篇文章都有原知乎文章链接:

下载知乎专栏的excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数和赞同数。

所有专栏文章生成的合集pdf:

批量下载某个公众号的所有历史文章批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/在看数/留言数/赞赏数,下载效果如图:

下载生成的excel文章数据包含每篇文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,分享数,赞赏次数,文章类型(群发/发布),是否删除,粉丝数,视频数,音频数等,比如深圳卫健委2022年的文章阅读数都是10万+,文章数据分析见文章2022年过去,抓取公众号阅读数点赞数在看数留言数做数据分析, 以深圳卫健委这个号为例

最后将所有文章合并成一个pdf文件 ,含文章留言和书签,点击左侧书签跳转到对应文章,里面包含了文章内容pdf和文章数据excel:

文章下的留言增加了留言时间。

以李健的微博为例,抓取2010-2023年所有的微博数据excel,包含微博链接,微博内容,发布时间,点赞数,转发数,评论数,话题等。2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

每个月的微博转评赞总数曲线,2015年是高峰。

微博原创与转发量曲线,2013年大量转发。

平常主要用iPad和网页版发微博。

微博内容生成的词云图效果:

我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值