2024批量下载知乎回答文章想法专栏视频,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf...

2024年我写了个脚本批量下载知乎回答/文章/想法/专栏/视频,公众号文章内容/话题/图片/封面/视频/音频,微博内容/图片/视频/评论/转发数据,导出excel和pdf。

下载所有知乎回答以渤海小吏的号为例:

2f401ffae985e0f4d9954e48aeaf210b.jpeg

导出的excel包含所有知乎回答问题标题和链接。57a4ba201ac69cf9272225722f139de3.jpeg然后用脚本将excel里的回答批量下载:261eab9ef71845006a8933bfe56b9c72.jpeg下载的所有回答html内容,文件名为回答日期加标题。a02d0eb83cd5066c3301a836d5c65135.jpeg接着批量将html转换pdf,效果见网盘https://pan.quark.cn/s/8522433ad346  3c80b6b77576f869c04da90d4a940bf7.jpeg

再将所有pdf合成一个pdf文件:e1112ba2c6323d88f4dc964d55ba0326.jpeg每个回答都有原知乎回答链接。1019489ece4dc3b6a633b9246103b2ad.jpeg

下载所有知乎文章以半佛仙人的号为例 :e97034850c929941d1604f36c58ac44c.jpeg

导出的excel数据包含知乎文章标题,链接,评论数和赞同数。bdaf64f800680d969abf4c1fe906cd30.jpeg然后用脚本将excel里的文章批量下载:6f78f3dc1fc8881d60646d854ac6bd1d.jpeg下载的所有文章html内容,文件名为回答日期加标题。15552f7a878c5eb84275ddc4c443edf0.jpeg接着批量将html转换pdf,效果见网盘https://pan.quark.cn/s/8522433ad346   c838db848cb3eba8015f4b8ae3ad96c4.jpeg

再将所有pdf合成一个pdf文件,每篇文章都有原知乎文章链接 再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf  :97ad2b07139a30c380078254dd700050.jpeg

还有知乎专栏批量下载,我录制了个简单的视频:

下载的excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数和赞同数。

e07d5d16daefb39ee8b900a00119410b.jpeg

所有专栏文章生成的合集pdf:960b9e3e7365450853d75ea7dc9931c7.jpeg还有文章内容html和视频,有问题可以加微信 sushengbuhuo  034efe6a4b2504256080a35e89b8fa3d.jpeg

再说批量下载某个公众号的所有历史文章批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/在看数/留言数/赞赏数 ,下载效果如图:

13079f278b75b2407c74aef703a90c30.jpeg

生成的excel文章数据包含每篇文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,分享数,赞赏次数,文章类型(群发/发布),是否删除,粉丝数,视频数,音频数等,比如深圳卫健委2022年的文章阅读数都是10万+,文章数据分析见文章2022年过去,抓取公众号阅读数点赞数在看数留言数做数据分析, 以深圳卫健委这个号为例 。d5a458cb6a71a00dd9ff23e9a6b4e048.jpeg

为了方便找历史文章2024批量导出公众号所有文章生成目录,这下方便找文章了,部分公众号的历史文章同步到了我的博客https://sushengbuhuo.github.io/blog ,持续更新,不用在手机上翻历史文章了公众号历史文章太多,手机上翻起来太费劲,怎么快速找到某一天的文章? ,比如深圳卫健委从2014到2024发布1万多篇文章,第一篇文章是这个:

720c683cab72b80c9b08f6c6c508a88f.jpeg

每篇文章下的留言内容也可以导出到excel,内容包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出html和pdf格式,含阅读数/点赞数/在看数/留言数/赞赏数,比如深圳卫健委在2022年的所有文章就有14万多条留言。

3bba7405d358f5d883822a8abc3c5155.jpeg
 

除了文章数据还有批量下载文章内容,这里以莫言老师的公众号为例,下载的所有历史文章内容和音频,视频 :8c30b654f666f3791fd4051ad3d6d1cd.jpeg

a0c4f7adac72d7026a4938c8810b4d69.jpeg
 

最后将所有文章合并成一个pdf文件 ,含文章留言和书签,点击左侧书签跳转到对应文章,网盘地址https://pan.quark.cn/s/afa15a7b027b ,里面包含了文章内容pdf和文章数据excel:5aaaa904ad4aa92a727e3d152febc6e0.jpeg

5e947f5474dd5882931aaa249d08dc63.jpeg文章下的留言增加了留言时间。 2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

0d129aedc500f564b9f3982574da84e0.png

最后是微博批量下载,以李健的微博为例https://weibo.com/u/1744395855 ,抓取2010-2024年所有的微博数据excel,包含微博链接,微博内容,发布时间,点赞数,转发数,评论数,话题等。 2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

数据详情见网盘 https://pan.quark.cn/s/bd6925a375181f028397d0b96f1fdd2ffa35fe3089cc.jpeg

每个月的微博转评赞总数曲线,2015年是高峰。65011a0a21ea6854a2760615f45a80f5.jpeg微博原创与转发量曲线,2013年大量转发。ed698f4aec6c2039fe78c168f85a958c.jpeg平常主要用iPad和网页版发微博。05bfe398dc3753cbbb51a255290c7928.jpeg

微博内容生成的词云图效果:2a65f7f6e93b3178a91aa207e140f86b.jpeg

导出所以微博内容生成pdf,大小 40MB。 

e635125f0019cddde80bd5ad0c129db8.png所有微博图片:

5dc62c99f06ad47c56cc76a91a3b17be.png

最新原创文章:

正式介绍下我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑

843c0be9569953208082750c005d59e6.jpeg
扫描二维码关注或搜索微信susheng_buhuo
d71f16db28e535ecca403bd57f2a7a36.jpeg
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值