数据结构与算法Python版 02 list和dict性能探究

最新推荐文章于 2024-04-21 10:46:56 发布

云崖先生

最新推荐文章于 2024-04-21 10:46:56 发布

阅读量193

点赞数

分类专栏：数据结构与算法Python版

本文链接：https://blog.csdn.net/weixin_43422005/article/details/118517601

版权

数据结构与算法Python版专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文探讨了Python中list和dict两种常用数据类型的性能。在Python设计中，常用操作如list的pop()和insert()、dict的查找速度优化，是为了保证主要操作的高效性。尽管非尾部操作可能导致list的O(n)复杂度，但dict的哈希存储确保了快速的单点查找。

摘要由CSDN通过智能技术生成

2种常用类型

在Python中，最常用的2种数据类型为list和dict。

你是否了解过它们的各种方法，时间复杂度到底如何？在那种策略下用那种方法更省时？

两种数据类型都拥有很多方法，常用的亦或是不常用的，因此在Python设计之初定下了一个原则：

让最常用的操作性能最好，牺牲不太常用的操作

在实际使用中，80%的功能其使用率往往只有20%，因此将剩下的20%的功能时间复杂度降低，而将不常用的80%功能时间复杂度增加，做到一种均衡的策略。

其实在Python官网上，已经贴出了每种数据类型方法的时间复杂度，点我跳转

dict

官方展示

The Average Case assumes parameters generated uniformly at random.

Internally, a list is represented as an array; the largest costs come from growing beyond the current allocation size (because everything must move), or from inserting or deleting somewhere near the beginning (because everything after that must move). If you need to add/remove at both ends, consider using a collections.deque instead.

Operation	Average Case	Amortized Worst Case
Copy	O(n)	O(n)
Append[1]	O(1)	O(1)
Pop last	O(1)	O(1)
Pop intermediate[2]	O(n)	O(n)
Insert	O(n)	O(n)
Get Item	O(1)	O(1)
Set Item	O(1)	O(1)
Delete Item	O(n)	O(n)
Iteration	O(n)	O(n)
Get Slice	O(k)	O(k)
Del Slice	O(n)	O(n)
Set Slice	O(k+n)	O(k+n)
Extend[1]	O(k)	O(k)
Sort	O(n log n)	O(n log n)
Multiply	O(nk)	O(nk)
x in s	O(n)
min(s), max(s)	O(n)
Get Length	O(1)	O(1)

pop()和inster()

pop()和inster()通常来说有2种情况：

如果都是操纵list[-1]，也就是最后一个数据项，它们的时间复杂度均为O(1)
如果操纵的是其他数据项，则时间复杂度均为O(n)

由于list底层是顺序存储，故任何一个非index-1的数据项的添加或删除都会引起整个列表的调整。

例如，从中部移除数据项的话，要把被移除数据项后面的全部数据项向前挪一个槽位。

虽然看起来有点笨拙，但这种实现方法能够保证列表按索引取值和赋值的操作很快，能够达到O(1)的良好情况。

这也算是一种对常用和不常用操作的折衷方案吧。

dict

官方展示

The Average Case times listed for dict objects assume that the hash function for the objects is sufficiently robust to make collisions uncommon. The Average Case assumes the keys used in parameters are selected uniformly at random from the set of all keys.

Note that there is a fast-path for dicts that (in practice) only deal with str keys; this doesn’t affect the algorithmic complexity, but it can significantly affect the constant factors: how quickly a typical program finishes.

Operation	Average Case	Amortized Worst Case
k in d	O(1)	O(n)
Copy[3]	O(n)	O(n)
Get Item	O(1)	O(n)
Set Item[1]	O(1)	O(n)
Delete Item	O(1)	O(n)
Iteration[3]	O(n)	O(n)

为什么字典这么快

dict内部采用hash存储，所以单点查找非常迅速，但不能使用范围查找。

这也是所有hash存储的特性，是属于一种典型的空间换时间的方案。

云崖先生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构与算法Python版 02 list和dict性能探究

2种常用类型在Python中，最常用的2种数据类型为list和dict。你是否了解过它们的各种方法，时间复杂度到底如何？在那种策略下用那种方法更省时？两种数据类型都拥有很多方法，常用的亦或是不常用的，因此在Python设计之初定下了一个原则：让最常用的操作性能最好，牺牲不太常用的操作在实际使用中，80%的功能其使用率往往只有20%，因此将剩下的20%的功能时间复杂度降低，而将不常用的80%功能时间复杂度增加，做到一种均衡的策略。其实在Python官网上，已经贴出了每种数据类型方法的时间复杂
复制链接

扫一扫