Python中的字符串为不可变对象,一旦创建便不能改变,这个特性直接影响到Python中字符串连接的效率。
name, address, school = "watkins", "siso", "swjtu"
# 使用操作符+
print(name + address + school)
# 使用join方法
print(''.join([name, address, school]))
当用操作符+
连接字符串的时候,在N个字符串连接的过程中会产生N-1个中间结果,每产生一个中间结果都需要申请和复制一次内存,总共需要申请N-1次内存,从而严重影响了执行效率。
而当用join()
方法连接字符串的时候,会首先计算需要申请的总的内存空间,然后一次性申请所需内存并将字符序列中的每一个元素复制到内存中去,所以join操作的时间复杂度为O(n)。
因此,字符串的连接,特别是大规模字符串的处理,应该尽量优先使用join而不是+。
(最近更新:2019年05月21日)