CPython数据结构相关操作的时间复杂度

原创 2016年08月31日 14:40:41

1. CPython和Python

    相信许多和博主一样的Python菜鸟在看到CPython的时候都会产生一个疑问:CPython和Python到底有啥区别?实际上CPython通常用于指代用C语言实现的Python。相应的,也存在其它语言实现的Python。比如:Jython,IronPython和PyPy,它们分别由Java,C#和RPython实现。我们从python.org下载的Python解释器就是用C语言实现的,也就是CPython。换言之,Python是编程语言,而CPython是此编程语言的实现方式。

    这篇博文中介绍的Python操作的时间复杂度都是基于CPython的,其它的Python实现在性能上会和CPython有些许不同。不过可以大胆的认为CPython不会比它们快过O(log n)倍。以下时间复杂度的介绍中,n指数据结构中的数据规模,k指参数值或者参数中的元素数量。


2. List

    平均情况下,所有参数都是随机均匀产生的。List最大的开销来自于内存分配大小的改变,以及插入和删除操作。因为这些情况下,list中的许多元素都涉及到移动操作。如果需要在两端增删元素,可以考虑使用collections.deque。



3. Collecions.deque

    此数据结构实际上是一个双向链表实现的双端队列,即元素的弹出,插入和删除可在两端进行。相应的,两端的操作会较为高效,而中间元素的操作则会比较慢。



4. Set

    集合的实现和字典差不多。


    

    上述表格中,值得一提的是集合求差集的两种操作。假设我们有两个集合s和t,第一种方式是s-t (或者s.difference(t)),第二种方式是s.difference_update(t)。这种方法的时间复杂度依赖的变量是不一样的。前者扫描整个集合s,然后将其中不在t中的元素放入新创建的一个集合变量中。因为集合的查找算法基于Hash表的,所以只有O(1)的时间复杂度,因此整个操作最耗时的部分是对集合s的扫描,复杂度为O(len(s))。对第二种算法,其本质是扫描t集合,然后将t中的每个元素从s中删除。整个过程不产生额外的内存需求,时间复杂度是O(len(t))。选用那种方式求差集在于两个集合的长度和是否需要产生新的集合。


5. Dictionary

    对于字典,平均性能是针对hash函数足够健壮的情形而言,也就是很少存在hash冲突。相应的,最坏的情况都是在冲突比较频繁的情况下产生的。


    

值得一提的是,此处最坏情况下的n并非是指当前字典的大小,而是从创建到目前为止,字典曾经达到的最大大小。比如,如果字典有N个元素,删除N-1个元素后,字典大小仍为N,直到新的插入操作产生。


6. 参考文献

https://wiki.python.org/moin/TimeComplexity

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

定义栈的数据结构在Theta(1)时间复杂度内实现min,pop,push操作

思路: push,pop操作在常量时间复杂度内完成,没有问题,但是,min操作需要在常量时间复杂度内完成,一开始很容易想到在栈中保存一个变量min,用来保存最小值,那么如果需要min()操作时,只需要...

设计队列容器的数据结构,使得返回最大元素的操作时间复杂度尽可能的低。

设计队列容器的数据结构,使得返回最大元素的操作时间复杂度尽可能的低。 解法1:用传统方式来实现队列,采用一个数组或链表来存储队列的元素,利用两个指针分别指向队尾和队首。如果采用这种方法,那么取最大值...

常用数据结构2——栈,实现PUSH、POP和取最小值操作算法时间复杂度为o(1)

看到一道笔试题,要求设计一个“栈”数据结构,使得对该栈的PUSH(进栈)、POP(出栈)以及取最小值(MIN)操作的时间复杂度为o(1)。我在网上搜了下,大家貌似也是用双栈来实现的。之所以说是双栈,是...

数据结构(一) 时间复杂度

数据结构马上就要考试了,抓紧复习下,听说数据结构对于这一行业来说挺重要的,所以就把复习的历程记录下来,以备后用(顺便装个X)。1.试分析下面各程序段的时间复杂度。(1)x=90; y=100; ...

《数据结构导论之时间复杂度》

Ѿ定义   ❶时间复杂度:   计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。   ❷最坏时间复杂度:   对相同输入数据量的不同输入数据,算法时间用量的最大值。   ❸平均...

数据结构中对于时间复杂度的初步了解

首先先了解几个概念 时间复杂度 (1)时间频度 一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多...

数据结构基础篇(2)--算法时间复杂度

算法的时间复杂度

常用数据结构的时间复杂度

一篇非常优秀的数据结构博客
  • stardhb
  • stardhb
  • 2016年01月03日 23:33
  • 2953

数据结构中排序和查找各种时间复杂度

(1)冒泡排序         冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排...

[数据结构] 时间复杂度的理解

时间复杂度:函数计算之行的基本次数 面试tip:面试官问及时间复杂度不一定只有最坏的,一般人一般会直接答最坏的,其实还有最好和平均。 例如:在一个长度为N的线性表中搜索一个数据x。 最坏:没有找...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:CPython数据结构相关操作的时间复杂度
举报原因:
原因补充:

(最多只允许输入30个字)