请注意,您选择的确定缩进的方法可能会对性能产生重大影响。例如,虽然可以使用正则表达式来测量前导空格,但有更简单且更有效的方法来测量前导空格。在import re
line = ' Then the result is even.'
r = re.compile(r"^ *")
%timeit len(line) - len(line.lstrip()) # 1000000 loops, best of 3: 0.387 µs per loop
%timeit len(re.findall(r"^ *", line)[0]) # 100000 loops, best of 3: 1.94 µs per loop
%timeit len(r.findall(line)[0]) # 1000000 loops, best of 3: 0.890 µs per loop
其他答案中的正则表达式速度较慢的原因是正则表达式是一个状态机,在构造正则表达式时进行编译。内部有一个缓存,但即使这样,最好自己手工编译和重用正则表达式。在
但是,请注意,正则表达式解决方案的速度只有第一个示例的20%(最坏情况下,如果使用预编译表达式,则为43%),该示例比较了去除空白前后的字符串。在
重要提示:Python将制表符解释为8个空格的缩进,因此在求值之前,您还需要.replace()文本制表符具有相等的空间量。在
编辑添加:Python解析器本身不关心特定的缩进级别,只关心给定的“块”是一致缩进的。缩进的增加量被有效地忽略和剥离,取而代之的是缩进和DEDENT标记。(16个空格的缩进→只有一个缩进标记)真正重要的是行与行之间缩进的变化。在