java合并不连续的时间段_基于时间戳不完全匹配的pandas合并

考虑以下迷你版本的问题:

from io import StringIO

from pandas import read_csv, to_datetime

# how close do sessions have to be to be considered equal? (in minutes)

threshold = 5

# datetime column (combination of date + start_time)

dtc = [['date', 'start_time']]

# index column (above combination)

ixc = 'date_start_time'

df1 = read_csv(StringIO(u'''

date,start_time,employee_id,session_id

01/01/2016,02:03:00,7261824,871631182

01/01/2016,06:03:00,7261824,871631183

01/01/2016,11:01:00,7261824,871631184

01/01/2016,14:01:00,7261824,871631185

'''), parse_dates=dtc)

df2 = read_csv(StringIO(u'''

date,start_time,employee_id,session_id

01/01/2016,02:03:00,7261824,871631182

01/01/2016,06:05:00,7261824,871631183

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值