以这个号为例李健,共抓取727条微博,导出的excel微博数据包含微博链接,微博正文,原始图片链接,被转发微博原始图片链接,是否为原创微博,微博视频链接,发布位置,发布时间,发布工具,点赞数,转发数,评论数,话题等2024 一键批量下载微博内容/图片/视频/评论/转发/阅读数等数据,导出word,excel和pdf
李健第一条微博发布于2010年。
下载的微博内容保存到word和txt,无水印图片,视频:
word微博内容:
所有微博内容合成一个word文件,大小不到100Kb 。
再根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10微博了。
import pandas as pd
df=pd.read_csv('weibo/歌手李健/1744395855.csv')
df['sort']=df['点赞数']+df['转发数']+df['评论数']
df.sort_values(by=['sort'],ascending=False, inplace=True)
df.head(10).to_csv('歌手李健.csv',encoding='utf_8_sig',index=False)
https://www.weibo.com/1744395855/LgnjmrmvF
https://www.weibo.com/1744395855/Cc3T09sqM
https://www.weibo.com/1744395855/C9UW2BmNd
https://www.weibo.com/1744395855/ChaNZmx6A
https://www.weibo.com/1744395855/Jfpw2xihv
https://www.weibo.com/1744395855/CfNZzoAMV
https://www.weibo.com/1744395855/Ckrkv2A0b
https://www.weibo.com/1744395855/Fn3bhwNWv
https://www.weibo.com/1744395855/Gt5of2OCo
https://www.weibo.com/1744395855/Gt5of2OCo
顺便分析下微博发布工具比例图:
微博内容词云图:
原创微博与转发数据分布图:
转发评论点赞数据分布图:
导出微博内容pdf,大小 40MB。
然后是批量下载微博评论,工具下载地址在公众号后台对话框回复 微博
,打开工具输入微博链接和网页版微博cookie就行,比如
导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。
对excel文件分析评论IP地址分布图:
对excel文件分析评论内容生成的词云图:
当然也支持批量下载微博评论,将所有微博链接放在一个txt文件,一行一个链接,打开工具输入文件名和cookie批量下载。
还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,比如这条微博有5000多条转发微博:
对excel文件分析微博转发ip地址分布图:
对excel文件分析微博转发内容词云图:
我最近又开发了个微博内容批量下载工具,工具下载地址在公众号后台对话框回复 微博
, 将cookie保存在cookie.txt文件,微博链接保存在txt文件,一行一个链接,支持weibo.com和m.weibo.cn链接格式,打开工具输入带微博链接的txt文件名就行:
导出的excel文件包含每条微博的微博发布时间,微博内容,微博连接,点赞数,评论数,转发数。
最后是v+微博批量下载导出excel ,数据包含微博发布时间,微博内容,微博连接,微博图片,当然需要先购买才能下载。