苏生不惑出品:2024 批量下载微博内容/图片/视频/评论/转发,导出excel和pdf

苏生不惑第490 篇原创文章,加入我的知识星球

之前分享过我写的几个工具2023 更新版:苏生不惑开发过的那些原创工具和脚本 ,今天再更新下微博下载。

还是以这个号为例https://weibo.com/n/歌手李健,共抓取727条微博,导出的excel微博数据包含微博链接,微博正文,原始图片链接,被转发微博原始图片链接,是否为原创微博,微博视频链接,发布位置,发布时间,发布工具,点赞数,转发数,评论数,话题等。

b52f1761ddfff0267cf5708661d29700.png第一条微博发布于2010年5月31  https://www.weibo.com/1744395855/OyJMj8f858aa678a55c92ccecd54c6d171c11.png

再根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10微博了。

import pandas as pd
df=pd.read_csv('weibo/歌手李健/1744395855.csv')
df['sort']=df['点赞数']+df['转发数']+df['评论数']
df.sort_values(by=['sort'],ascending=False, inplace=True)
df.head(10).to_csv('歌手李健.csv',encoding='utf_8_sig',index=False)
https://www.weibo.com/1744395855/LgnjmrmvF
https://www.weibo.com/1744395855/Cc3T09sqM
https://www.weibo.com/1744395855/C9UW2BmNd
https://www.weibo.com/1744395855/ChaNZmx6A 
https://www.weibo.com/1744395855/Jfpw2xihv
https://www.weibo.com/1744395855/CfNZzoAMV
https://www.weibo.com/1744395855/Ckrkv2A0b
https://www.weibo.com/1744395855/Fn3bhwNWv
https://www.weibo.com/1744395855/Gt5of2OCo
https://www.weibo.com/1744395855/Gt5of2OCo

再分析下微博发布工具比例图:

45656363d24b5e8e491ae59dc3ffecaf.png

微博内容词云图:edc4f748926fcf0b0513e2de6d2e232f.png原创微博与转发数据分布图:2f1b32c40b12f261486f81a1164cb8e9.png转发评论点赞数据分布图:28f8bf6f5c6b598458765add8b41f19a.png

导出pdf,大小 40MB。 

503d03b3b81974502c55c977fadb8df7.png所有微博图片:

e8186223eb8dedf3b1493ddb76fc7f47.png然后是批量下载微博评论,工具下载地址在公众号后台对话框回复 微博

打开工具输入微博链接和网页版微博cookie就行,比如 https://weibo.com/1744395855/O0haQaIfE,https://m.weibo.cn/detail/5000660202553386b7adf70dd9a2d2a4794310c23cffba01.png不过下载的评论比实际评论数少很多,可能被微博过滤了,点击加载更多没反应。

39d4fb3c3c65cd97f08d9c9b4d6795c7.png

导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。

ce8ac9ecfb06f8de1b1c6ad50608b33a.png对excel文件分析评论IP地址分布图:

d5c6e3585072bf0223643f5fe2b62a18.png

对excel文件分析评论内容生成的词云图:1b542d14f569264394fc9937495ca5dc.png

还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,比如https://m.weibo.cn/status/5000660202553386这条微博有5000多条转发微博:b8e5739049e26775e007f4d5f8b6611b.png对excel文件分析微博转发ip地址分布图:

6100560f9d996a0bc1db0059ff637860.png

对excel文件分析微博转发内容词云图:

ccc0b04f0354c0061d86e0d52cbbd105.png

最后分享个查看微博无水印图片小技巧,有水印图https://lz.sinaimg.cn/mw690/001U3j31ly1gnynq1xvcqj634022oqv502.jpg替换为oslarge就是无水印图https://lz.sinaimg.cn/oslarge/001U3j31ly1gnynq1xvcqj634022oqv502.jpg,效果对比:

523fc5123bf9e5829baf560a8cda37d7.png 3a279ba3a42969c33191cde79e295066.png

今日分享资源,收藏后再看,以防链接失效:

2024 事业单位考试

https://pan.quark.cn/s/c876b6d41695

普通人业余时间收入翻10倍的学习方法

https://pan.quark.cn/s/139d4774f0f7

最新原创文章:

正式介绍下我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

一次性搞定微博,苏生不惑又写了个脚本,一键下载微博内容导出pdf,批量抓取微博评论转发数据导出excel

苏生不惑出品:2024 批量下载知乎回答,文章和想法,导出 excel 和 pdf ,文章数据包括标题,链接,赞同数

下载视频不求人,免费下载全网视频

全网电子书都在这了:ZLibrary 官方通道来了,不再担心找不到最新地址,配合这个脚本简直完美

2024 最新阿里云盘/百度网盘/夸克网盘资源搜索神器

研究了下莫言的公众号,发现。。。

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑

406227df887b04c2d9cfcaa5274b1b4f.jpeg
扫描二维码关注或搜索微信susheng_buhuo
010219339c585db50358a00d7221e6c0.jpeg
 
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
@Autowired和@Resource都是Spring框架中用于实现依赖注入的注解。它们的作用是将一个对象自动注入到另一个对象中,以实现对象之间的依赖关系。 @Autowired注解可以用于字段、构造方法和方法上。它默认按照byType自动注入,即根据类型来匹配需要注入的对象。如果有多个匹配的对象,则会抛出异常。可以通过设置required属性为false来允许注入null值。如果想使用名称装配,可以结合@Qualifier注解使用。\[1\] @Resource注解也可以用于字段、构造方法和方法上。它默认按照byName自动注入,即根据名称来匹配需要注入的对象。可以通过设置name属性来指定需要注入的对象的名称,或者通过设置type属性来指定需要注入的对象的类型。如果既不指定name也不指定type属性,则会通过反射机制使用byName自动注入策略。\[1\] \[2\] 综上所述,@Autowired和@Resource都是用于实现依赖注入的注解,它们的作用是将一个对象自动注入到另一个对象中。@Autowired按照byType自动注入,@Resource默认按照byName自动注入。 #### 引用[.reference_title] - *1* *3* [@Autowired 与@Resource的区别(详细)转载](https://blog.csdn.net/yang_1011123/article/details/108800874)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [@Autowired和@Resource区别](https://blog.csdn.net/Mao_yafeng/article/details/124739487)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值