Python数据结构与算法-概念引入

算法

算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。
一般地,算法处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。

算法特性

输入: 算法具有0个或多个输入
输出: 算法至少有1个或多个输出
有穷性: 算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成
**确定性:**算法中的每一步都有确定的含义,不会出现二义性
**可行性:**算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完成

算法效率衡量

时间复杂度与“大O记法”

算然对于不同机器环境而言,确切的单位时间是不同的,但对于算法进行多少个基本操作(即花费多少时间单位)在规模数量级上却是相同的。由此可以忽略机器环境的影响而客观反映算法的时间效率。

大O记法

对于单调的整数函数f,如果存在一个整数函数g和实常数c>0,使得对于充分大的n总有f(n)<=c*g(n),就说函数g是f的一个渐近函数(忽略常数),记为f(n)=O(g(n))。也就是说,在趋向无穷的极限意义下,函数f的增长速度受到函数g的约束,亦即函数f与函数g的特征相似。

时间复杂度

时间复杂度:假设存在函数g,使得算法A处理规模为n的问题示例所用时间为T(n)=O(g(n)),则称O(g(n))为算法A的渐近时间复杂度,简称时间复杂度,记为T(n)

最坏时间复杂度

分析算法时,存在几种可能的考虑:

最优时间复杂度:
算法完成工作最少需要多少基本操作。
价值不大,因为它没有提供什么有用信息,其反映的只是最乐观最理想的情况,没有参考价值。
最坏时间复杂度:
算法完成工作最多需要多少基本操作。
提供了一种保证,表明算法在此种程度的基本操作中一定能完成工作。
平均时间复杂度:
算法完成工作平均需要多少基本操作。
对算法的全面评价,因此完整全面地反映了算法性质。但另一方面,这种衡量并不能保证每个计算都能在这个基本操作内完成。而且,对于平均情况的计算,也会因为应用算法的实例分布可能并不均匀而难以计算。

因此,主要关注算法的最坏情况,亦即最坏时间复杂度。

时间复杂度基本计算规则

基本操作:
即只有常数项,认为其时间复杂度为O(1)。
顺序结构:
时间复杂度按加法进行计算。
循环结构:
时间复杂度按乘法进行计算。
分支结构:
时间复杂度取最大值。
2.
判断一个算法的效率时,往往只需要关注操作数量的最高次项,其它次要项和常数项可以忽略。
3.
在没有特殊说明时,我们所分析的算法的时间复杂度都是指最坏时间复杂度

常见时间复杂度及其之间关系

在这里插入图片描述

Python内置类型性能分析

可使用timeit模块测试一小段Python代码的执行速度。
例1:生成一个元素为0—999的列表的各式操作

def test1():       #直接使用“+”运算符将生成的列表片段与原列表拼贴
    l = []
    for i in range(1000):
        l = l + [i]
def test2():    #使用在列表尾部添加元素的append方法
    l = []
    for i in range(10000):
        l.append(i)
def test3():       #使用列表解析式
    l = [i for i in range(1000)]
def test4():      #生成range对象再转换为列表
    l = list(range(1000))
def test5():     #使用列表extend方法将生成的列表片段加在原列表尾部
    l=[]
    for i in range(1000):
        l.extend([i])
def test6():      #使用列表insert方法将元素添加至特定索引处
    l=[]
    for i in range(1000):
        l.insert(-1,i)
def test7():      #使用“+=”运算符将生成的列表片段与原列表拼贴
    l=[]
    for i in range(1000):
        l+=[i]


from timeit import Timer

t1 = Timer("test1()", "from __main__ import test1")
print("concat ",t1.timeit(number=1000), "seconds")
t2 = Timer("test2()", "from __main__ import test2")
print("append ",t2.timeit(number=1000), "seconds")
t3 = Timer("test3()", "from __main__ import test3")
print("comprehension ",t3.timeit(number=1000), "seconds")
t4 = Timer("test4()", "from __main__ import test4")
print("list range ",t4.timeit(number=1000), "seconds")
t5 = Timer("test5()", "from __main__ import test5")
print("extend ",t5.timeit(number=1000), "seconds")
t6 = Timer("test6()", "from __main__ import test6")
print("insert ",t6.timeit(number=1000), "seconds")
t7 = Timer("test7()", "from __main__ import test7")
print("+= ",t7.timeit(number=1000), "seconds")

在这里插入图片描述
由输出结果可见,list range方法效率最高,concat方法效率最低。

例2:pop操作测试

x = list(range(2000000))
pop_zero = Timer("x.pop(0)","from __main__ import x")
print("pop_zero ",pop_zero.timeit(number=1000), "seconds")
x = list(range(2000000))
pop_end = Timer("x.pop()","from __main__ import x")
print("pop_end ",pop_end.timeit(number=1000), "seconds")

在这里插入图片描述
从结果可以看出,pop最后一个元素的效率远远高于pop第一个元素。

列表和字典内置操作时间复杂度
列表

在这里插入图片描述
获取某索引值对应的元素:O(1)
将值赋给某索引值对应的元素:O(1)
append方法在列表尾部添加元素:O(1)
pop方法删除并返回列表尾部元素:O(1)
pop方法删除并返回列表某索引值对应元素:O(n)
insert方法在列表指定位置index处增加元素x:O(n)
del方法删除元素:O(n)
迭代列表:O(n)
用in判断某元素是否存在于列表:O(n)
获取列表切片(起始索引x,结束索引y,y-x=k):O(k)
删除列表切片:O(n)
将长度为k的列表切片替换为新列表:O(n+k)
reverse方法将列表元素顺序颠倒:O(n)
用“+”将长度为k的列表拼贴于列表:O(k)
sort方法排序列表:O(nlogn)
multiply方法将列表乘以k:O(nk)

字典

在这里插入图片描述
复制字典:O(n)
由键获取某键值对:O(1)
设置键值对:O(1)
删除键值对:O(1)
用in判断元素是否在字典中:O(1)
迭代:O(n)

数据结构

概念

数据是一个抽象概念,将其进行分类后得到程序设计语言中的基本类型。如:int,float,char等。但数据元素间不是独立的,存在特定的关系,这些关系便是结构。
数据结构指数据对象中数据元素之间的关系。

Python系统定义好的、不需要自己去定义的数据结构叫做Python的内置数据结构,如列表、元组、字典。
而有些数据组织方式,Python系统里面没有直接定义,需要自己定义实现这些数据的组织方式,这些数据组织方式称之为Python的扩展数据结构,如栈,队列等。

算法与数据结构的区别

数据结构只是静态的描述了数据元素之间的关系。
高效的程序需要在数据结构的基础上设计和选择算法。

程序 = 数据结构 + 算法

总结:算法是为解决实际问题而设计的,数据结构是算法需要处理的问题载体。

抽象数据类型(Abstract Data Type)

含义为:一个数学模型以及定义在此数学模型上的一组操作。
即,把数据类型和数据类型上的运算捆在一起,进行封装。

引入抽象数据类型的目的:把数据类型的表示和数据类型上运算的实现与这些数据类型和运算在程序中的引用隔开,使它们相互独立。

最常用的数据运算有五种:插入、删除、修改、查找、排序

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值