python分时间段统计_Python Pandas:按日期分组并统计每个时段的新记录

我正在尝试使用Python Pandas来计算一段时间内每天访问我网站的访问者。在

示例数据:df1 = pd.DataFrame({'user_id':[1,2,3,1,3], 'date':['2012-09-29','2012-09-30','2012-09-30','2012-10-01','2012-10-01']})

print df1

date user_id

0 2012-09-29 1

1 2012-09-30 2

2 2012-09-30 3

3 2012-10-01 1

4 2012-10-01 3

我想要的最终结果是:

^{pr2}$

第一天有1个新用户,因为用户1是第一次出现的。在

第二天有两个新用户:用户2和用户3都是第一次出现。在

最后在第三天有0个新用户:用户1和用户3在以前的时间段中都已经出现过。在

到目前为止,我一直在考虑合并同一数据帧的两个副本,并按日期移动一个副本,但没有成功:pd.merge(df1, df1.user_id.shift(-date), on = 'date').groupby('date')['user_id_y'].nunique()

任何帮助都将不胜感激

谢谢

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值