python统计计算时间_按日期时间统计中的记录数

这篇博客讲述了如何使用Python的Pandas库将数据加载到DataFrame中,并按日期时间间隔聚合数据,计算每个间隔内的记录数。作者展示了通过datetime属性进行分组和计数的方法,并绘制了线图来展示结果。此外,博主希望找到更优雅且高效的方法,以及如何将‘类型’字段拆分为三行。
摘要由CSDN通过智能技术生成

我将一些数据加载到PandasDataFrame中,我想将这些数据聚合到日期时间间隔中,并计算每个间隔内的记录数。问题是,我发现的聚合到日期时间间隔并计算每个间隔内的记录数的方法看起来相当笨拙,而且可能不是最有效的方法。改变我想分组计算tweet数量的间隔也是一件痛苦的事。在data = [[Timestamp('2016-10-26 18:47:53'), 'mention'],

[Timestamp('2016-10-26 20:28:35'), 'retweet'],

[Timestamp('2016-10-26 20:57:38'), 'tweet'],

[Timestamp('2016-10-26 21:36:37'), 'mention'],

[Timestamp('2016-10-26 22:49:08'), 'tweet'],

[Timestamp('2016-10-27 00:10:19'), 'tweet'],

[Timestamp('2016-10-27 01:14:46'), 'tweet'],

[Timestamp('2016-10-27 01:45:03'), 'retweet'],

[Timestamp('2016-10-27 02:33:03'), 'tweet'],

[Timestamp('2016-10-27 05:55:52'), 'retweet'],

[Timestamp('2016-10-27 14:26:57'), 'mention'],

[Timestamp('2016-10-27 17:46:42'), 'tweet'],

[Timestamp('2016-10-27 17:53:33'), 'retweet'],

[Timestamp('2016-10-27 18:53:38'), 'tweet'],

[Timestamp('2016-10-27 21:02:00'), 'retweet'],

[Timestamp('2016-10-27 21:23:50'), 'retweet'],

[Timestamp('2016-10-27 22:21:01'), 'retweet'],

[Timestamp('2016-10-28 05:30:02'), 'retweet'],

[Timestamp('2016-10-28 13:11:01'), 'retweet'],

[Timestamp('2016-10-28 16:55:13'), 'retweet'],

[Timestamp('2016-10-28 18:25:02'), 'retweet'],

[Timestamp('2016-10-28 18:54:44'), 'retweet'],

[Timestamp('2016-10-28 19:22:14'), 'tweet'],

[Timestamp('2016-10-28 19:23:20'), 'tweet'],

[Timestamp('2016-10-28 22:33:03'), 'tweet']]

df = pd.DataFrame(data, columns=['datetime', 'type'])

df['type'].groupby([df.datetime.dt.month, df.datetime.dt.day,df.datetime.dt.hour]).count().plot(kind="line")

如果你还可以帮助我找出如何把“类型”分成3行的话,你就可以得到额外的分数!:)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值