我写了几个微博脚本,一键批量下载批量下载微博图片/视频/内容/评论/转发,导出微博excel数据包含微博链接,内容,点赞数,转发数,评论数,话题等。2024 批量下载微博内容/图片/视频/评论/转发,导出excel和pdf
以歌手李健这个号为例,共抓取727条微博,导出的excel微博数据包含微博链接,微博正文,原始图片链接,被转发微博原始图片链接,是否为原创微博,微博视频链接,发布位置,发布时间,发布工具,点赞数,转发数,评论数,话题等。
第一条微博发布于2010年5月31
再根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10微博了。
import pandas as pd
df=pd.read_csv('weibo/歌手李健/1744395855.csv')
df['sort']=df['点赞数']+df['转发数']+df['评论数']
df.sort_values(by=['sort'],ascending=False, inplace=True)
df.head(10).to_csv('歌手李健.csv',encoding='utf_8_sig',index=False)
下载的所有微博图片:
下载的所有微博视频:
再分析下微博发布工具比例图:
微博内容词云图:
原创微博与转发数据分布图:
转发评论点赞数据分布图:
导出所有微博内容pdf。
想导出单条微博的评论数据见之前文章一键批量下载微博评论数据,并分析ip归属地分布,包含评论时间,评论用户昵称,评论内容,点赞数和ip归属地等:
对excel文件分析评论IP地址分布图:
对excel文件分析评论内容生成的词云图:
还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,这条微博有5000多条转发微博:
再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数
一次性搞定微博,苏生不惑又写了个脚本,一键下载微博内容导出pdf,批量抓取微博评论转发数据导出excel
苏生不惑出品:2024 批量下载知乎回答,文章和想法,导出 excel 和 pdf ,文章数据包括标题,链接,赞同数