假设我需要一个片段,从序列的末尾seq到给定项的第一次出现{}(包括首尾)。天真地尝试编写seq[-1:seq.index(x)-1:-1]会产生一个微妙的错误:seq = 'abc'
seq[-1:seq.index('b')-1:-1] # 'cb' as expected
seq[-1:seq.index('a')-1:-1] # '' because -1 is interpreted as end of seq
有什么惯用的写作方法吗?在
seq[seq.index(x):][::-1]工作正常,但是对于大序列来说可能效率低下,因为它会创建额外的副本。(我最后确实需要一个序列,所以需要一个副本;我只是不想创建第二个副本。)
另一方面,这是一个非常容易引入的bug,它可以通过许多测试,并且任何静态分析器都无法检测到它(除非它用一个否定的步骤警告每个切片)。在
更新
似乎没有完美的/惯用的解决办法。我同意这可能不像我想的那样经常成为瓶颈,所以在大多数情况下我将使用[pos:][::-1]。当性能很重要时,我会使用普通的if检查。然而,我会接受我觉得有趣的解决方案,尽管它很难阅读;它可能在某些罕见的情况下可用(我真的需要把整个东西放入表达式中,我不想定义新函数)。在
同时,我试着计时。对于单子来说,即使只有2个条目那么短,额外的一个片段也会受到2倍的惩罚。对于字符串,结果非常不一致,以至于我什么也说不出来:
^{pr2}$
列表的结果(额外切片/无额外切片时间的比率):2 2.667782437753884
5 2.2672817613246914
10 1.4275235266754878
100 1.6167102119737584
1000 1.7309116253903338
10000 3.606259720606781
100000 2.636049703318956
1000000 1.9915776615090277
当然,这忽略了这样一个事实,即当切片较短时,无论我们对生成的切片做什么处理都要付出更大的代价。所以,我还是同意,对于小规模的序列,[::-1]通常是非常好的。在