列表与元组,到底用哪个?

在之前的文章《python数据分析(python基础语法)》中介绍过pythond中的六种标准的数据结构,其中列表list,元组tuple长得非常像,你有没有想过,列表和元组到底区别在哪儿呢?本篇文章将回答你的问题。

我们先来回顾下他们的基本概念及方法:

  • 列表list和元组tuple,都是一个可以放置任意数据类型的有序集合,并且都可以随意嵌套。
  • 列表list是动态的,长度大小不固定,可以随意增加、删减或者改变元素。
  • 元组tuple是静态的,长度大小固定,无法增加、删减或改变元素。除非创建一个新的元组。
  • 列表list和元组tuple都支持初始化、索引及切片操作。
  • 列表list和元组tuple都包含一些常用的内置函数:.count().index().reverse()/reversed().sort()/sorted()等。

以上可能都是大家已知的,不再赘述,我们看看列表和元组更深层次的一些区别:

列表与元组存储方式的差异

前面说了,列表和元组最重要的区别就是,列表是动态的、可变的,二元组是静态的、不可变的。这样的差异,势必会影响两者的存储方式。我们来看下面的例子:

l=[1,2,3]
l.__sizeof__()
# 64
tup=(1,2,3)
tup.__sizeof__()
# 48

我们可以看到,对于列表和元组,我们放置了相同的元素,但是元组的存储空间却比列表少16个字节。这是为什么呢?

事实上,由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,int型为8字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8字节),这样才可以实时追踪列表空间的使用情况,当空间不足时,及时分配额外空间。

l=[]
l.__sizeof__()
# 40  //空列表的存储空间为40字节
l.append(1)
l.__sizeof__()
# 72  //加入元素 1 之后,列表为其分配了可以存储4个元素的空间 (72-40)/8=4
l.append(2)
l.__sizeof__()
# 72  //由于之前已经分配了空间,所以加入元素 2,列表空间不变
l.append(3)
l.__sizeof__()
# 72  //同上
l.append(4)
l.__sizeof__()
# 72  //同上
l.append(5)
l.__sizeof__()
# 104  //加入元素 5 之后,列表的空间不足,所以又额外分配了可以存储4个元素的存储空间

上面的例子,大家对列表list空间分配的过程是不是有了大概的了解?我们可以看到,为了减小每次增加/删减操作时空间分配的开销,python每次分配空间都会额外多分配一些,这样的机制(over-allocating)保证了其操作的高效性。

但是对于元组tuple,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。可以看出,元组的要比列表更加轻量级一些。

列表与元组的性能

python有一个垃圾回收机制,就是在后台对静态的数据做一些资源缓存(resourse caching)。如果一些变量不被使用了,python就会回收他们所占用的内存,返还给操作系统,以便其他变量和其他应用使用。

但是对于一些静态变量,比如元组,如果他不被使用,并且占用空间不大时,python会暂时缓存这部分内存。这样,下次我们再创建同样大小的元组时,python就可以不用再向操作系统发出请求,去寻找内存,而是而是可以直接分配之前缓存的内存空间,这样就能大大加快程序运行的速度。

下面的例子,我们用timeit模块的函数来计算初始化一个相同元素的列表和元组,索引操作分别所用的时间。比较下元组和列表的性能:

import timeit

# 初始化
print(timeit.timeit (stmt='x=[1,2,3,4,5]',number=10000000))
# 0.5384310339999274
print(timeit.timeit (stmt='x=(1,2,3,4,5)',number=10000000))
# 0.12699467200002346
# 索引操作
print(timeit.timeit (stmt='x=[1,2,3,4,5];y=x[3]',number=10000000))
# 0.7750472509999327
print(timeit.timeit (stmt='x=(1,2,3,4,5);y=x[3]',number=10000000))
# 0.32637773800001924

可以发现,在执行1000万次循环之后,无论是初始化还是索引操作,元组的耗时都要比元组少,也就是说,元组的性能要优于列表。

列表和元组的使用场景

根据上面的分析,我们可以做一个总结,来区分列表和元组的使用场景:

  • 列表是动态的,长度大小可变,可以随意的增加、删减、改变元素,列表的存储空间略大于元组,且性能稍差。
  • 元组是静态的,长度大小固定,不可以对元素进行增加、删减或更改操作,元组相对于列表更加轻量级,性能更好。
  • 如果存储的数据和数量不变,比如你有一个函数,返回地点的经纬度,那么肯定选用元组更合适。
  • 如果存储的数据或数量可变,比如社交平台上的一个日志功能,是统计一个用户在一周之内看了那些帖子,那么则用列表更合适。

思考题:

想创建一个空列表,我们可以用下面A,B两种方式,请问他们在效率上有事吗区别嘛?我们应该优先考虑是用那种呢?

#创建空列表
#option A
empty_list = list[]

#option B
empty_list = []

大家可以用``timeit`模块来测试下运行速度,在留言里附上你的答案哦!

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值