2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

之前分享过我写的几个工具2023 更新版:苏生不惑开发过的那些原创工具和脚本 ,今天再更新下微博下载,有需要加微信 sushengbuhuo

还是以这个号为例Sina Visitor System歌手李健,共抓取727条微博,导出的excel微博数据包含微博链接,微博正文,原始图片链接,被转发微博原始图片链接,是否为原创微博,微博视频链接,发布位置,发布时间,发布工具,点赞数,转发数,评论数,话题等。

第一条微博发布于2010年5月31

再根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10微博了。

import pandas as pd
df=pd.read_csv('weibo/歌手李健/1744395855.csv')
df['sort']=df['点赞数']+df['转发数']+df['评论数']
df.sort_values(by=['sort'],ascending=False, inplace=True)
df.head(10).to_csv('歌手李健.csv',encoding='utf_8_sig',index=False)

再分析下微博发布工具比例图:

微博内容词云图:

原创微博与转发数据分布图:

转发评论点赞数据分布图:

导出pdf,大小 40MB。

所有微博图片:

然后是批量下载微博评论,打开工具输入微博链接和网页版微博cookie就行,比如:

不过下载的评论比实际评论数少很多,可能被微博过滤了,点击加载更多没反应。

导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。

对excel文件分析评论IP地址分布图:

对excel文件分析评论内容生成的词云图:

还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,比如这条微博有5000多条转发微博:

对excel文件分析微博转发ip地址分布图:

对excel文件分析微博转发内容词云图:

最后分享个查看微博无水印图片小技巧,有水印图替换为oslarge就是无水印图,效果对比:

最新原创文章:

我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024 年还有人不会安装使用脚本神器?手把手教你

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值