python时间序列异常值查找_python – 查找时间序列数据的总持续时间,不重叠

我有一个包含开始和结束时间戳的记录列表,如下所示:

[{u'end_time': 1444197616.0, u'start_time': u'2015-10-07T05:59:58Z'}, ...]

这些时间段可以重叠,我无法弄清楚如何找到没有重叠的总持续时间.例如:

BEGIN END

03:00 03:03

03:02 03:05

03:04 03:05

03:01 03:06

03:08 03:10

0 - 3

2 - 5

4 - 5

1 - 6

8 - 10

总计= 8分钟.

我想我可以通过找到差距来做到这一点,但是如何?

解决方法:

我将解决常规浮动中的范围,它应该很容易延伸到日期时间……

让我们假设数据是[开始,结束]列表的序列.如果不是这种格式,您可以轻松地将其转换为此格式.

首先,我按开始时间对数据进行排序.这使事情变得更容易,因为您现在知道索引i 1的范围只能扩展索引i的范围,被索引i的范围所包含,或者它的开始是下一个折叠范围的开始.

接下来,我将查看当前索引和下一个索引的范围的开始和结束.如果下一个索引的开始位于当前范围内,则可以将其折叠为一个.继续这样做,直到下一个索引的开始不在当前范围内,然后产生当前范围.我认为应该看起来像这样:

def get_collapsed_ranges(ranges):

ranges = iter(sorted(ranges))

current_range = next(ranges)

for start, end in ranges:

if start > current_range[1]:

yield current_range

current_range = [start, end]

elif end > current_range[1]:

current_range[1] = end

yield current_range

我没有对此进行过广泛的测试,但它至少适用于您的测试数据:

>>> list(get_collapsed_ranges([[0,3], [2,5], [4,5], [1,6], [8,10]]))

[[0, 6], [8, 10]]

当然,从这里开始,要获得总持续时间,您可以将折叠范围内的差异和Bob的叔叔相加.

标签:python

来源: https://codeday.me/bug/20190711/1433336.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值