我有不同的身份证,开始日期和结束日期,
比如说:[
(5, d.datetime(2010, 9, 19, 0, 0, 0), d.datetime(2010, 9, 19, 0, 5, 10)),
(6, d.datetime(2010, 9, 19, 0, 0, 0), d.datetime(2010, 9, 19, 12, 59, 59)),
(4, d.datetime(2010, 9, 19, 10, 30, 17), d.datetime(2010, 9, 19, 20, 20, 59)),
(6, d.datetime(2010, 9, 19, 14, 12, 0), d.datetime(2010, 9, 19, 23, 59, 59)),
(5, d.datetime(2010, 9, 19, 17, 0, 22), d.datetime(2010, 9, 19, 19, 14, 20))
]
我需要找到重叠的时间范围,并准备一个新的列表,在特定的时间范围内有适当的ID,例如上面的列表结果应该是:
^{pr2}$
视觉概念:
实际上现在我有这样的解决方案:我得到整个范围的最小和最大日期,然后每1秒从min_date迭代到max_date,当在特定的时刻我们匹配目标列表中的一些间隔时,我将匹配的id保存为dictionary key,并将iterator到list的时间作为value,然后保存到父列表中,然后下一个接着一个。最后,我检查了父列表中的所有dict,将id作为键,将值列表中的第一个、最后一个日期作为需要查找的范围。
但当我计算月份的范围时,这个解决方案的工作非常缓慢。因为它花费了太多的时间以秒为单位迭代1个月。在
代码如下:def delta(start, end, delta):
cur = start
while cur < end:
yield cur
cur += delta
final_ranges = []
last_result = None
i = -1
for checker_date in delta(
sorted_ranges_by_start[0]['start'],
sorted_ranges_by_end[-1]['end'],
relativedelta(seconds=1)):
aggregator = []
for rng in ranges:
if rng['start'] <= checker_date <= rng['end']:
aggregator.append(str(rng['id']))
if len(aggregator) > 0:
ids = ','.join(set(aggregator))
if last_result != ids:
final_ranges.append({})
last_result = ids
i += 1
if ids not in final_ranges[i]:
final_ranges[i][ids] = []
final_ranges[i][ids].append(checker_date)
但正如我所说,它在大范围内工作非常缓慢。在
在没有迭代的情况下,也许可以通过这种方式来改进Python的迭代速度(或者,请尝试用C来改进它)
谢谢。在