微博爬虫/数据分析/可视化

本文通过对接近1亿条微博数据的分析,聚焦《广州发布》账号,揭示了微博互动变化,点赞数增长,转发和评论减少的现象。通过数据可视化展示了发博量在年初下降,周末活跃,以及不同时间段的用户活跃度。同时,发现《广州发布》的多渠道发布特征,暗示背后可能存在多人运营。未来计划进行情感分析和文本聚类研究。
摘要由CSDN通过智能技术生成

微博的数据分析以及可视化

最近在学习数据分析,数据挖掘以及数据可视化的内容,之前断断续续地采集了接近1亿条微博数据,还有几十万的用户的信息。所以筛选了一部分数据来分析分析。下面的内容大多以《广州发布》为例。

  • 微博数量分析
  • 微博时间分析
  • 地域分析
  • 数据可视化

《中国广州发布》是广州市互联网信息办公室的官方微博账号。截止到6月27号凌晨,一共采集了广州发布50138条微博。这里面只有很小部分是转发的,其他都是原创。
这里写图片描述

现在看看这5万多条微博的一个数据总览。
这里写图片描述
发现几个比较奇怪的地方,2013年下半年有一个节点怎么微博的转发数和评论数突然爆炸增长,然后2017年也有一个节点获得的赞数特别多。我们详细看看这两个点。
这里写图片描述

通过代码对数据筛选,可以看到2013年8月是有一个高峰,

评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值