场景
x = [[1, 2], [3, 4], [5, 6]...]
y = [[7, 8], [9, 10], [11, 18]...]
保证y
中每一个值如[7, 8]
一定出现在x
中,现需要求y
中所有值在x
中的索引。
方法
一般做法:
idx = [x.index(t) for t in y]
然而,由于index
的检索复杂度为O(n)
,当x
数量巨大时,时间往往是不可接受的。
为此,我们可以考虑使用字典,字典的查询时间复杂度始终为O(1)
。
由于python中list是unhashable的,因此我们首先需要将list转为元组类型再进行映射:
x = [tuple(t) for t in x]
x_dict = dict(zip(x, [x for x in range(len(x))]))
此时再次查找y
中元素的索引,速度可以提升好几个数量级:
y = [tuple(t) for t in y]
idx = [x_dict[t] for t in y]
print(idx)