python数据结构1 算法的引入

1、 算法的引入

(1) 算法的概念:

算法是计算机处理信息的本质,因为计算机程序本质上是一个算的发来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。

(2) 独立性

算法是独立存在的一种解决问题的方法和思想,和语言无关

(3) 算法的五大特征

A.	输入:算法具有0个或多个输入
B.	输出:算法至少有1个或多个输出
C.	有穷性:算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成
D.	确定性:算法中的每一步都有确定的意义,不会出现二义性
E.	可行性:算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完成。
# 如果a+b+c=1000,且a^2+b^2=c^2(a,b,c为自然数),如何求出所有a/b/c可能的组合?
import time

start_time=time.time()
for a in range(0,1001):
    for b in range(0,1001):
        for c in range(0,1001):
            if a+b+c==1000 and a**2+b**2==c**2:
                print("a,b,c:%d,%d,%d"%(a,b,c))
end_time=time.time()
print("times:%d"%(end_time-start_time))
print("finished")

输出结果:
在这里插入图片描述
这个程序时间太长

优化代码:

# 如果a+b+c=1000,且a^2+b^2=c^2(a,b,c为自然数),如何求出所有a/b/c可能的组合?
import time

start_time=time.time()
for a in range(0,1001):
    for b in range(0,1001):
        c=1000-a-b
        if a**2+b**2==c**2:
            print("a,b,c:%d,%d,%d"%(a,b,c))
end_time=time.time()
print("times:%d"%(end_time-start_time))
print("finished")

输出结果:
在这里插入图片描述

2、 算法效率衡量

执行时间反映算法效率,对于同一个问题我们给出了两种解决算法,在两种算法的实现中,我们对程序执行的时间进行了测算,发现两段程序执行的时间相差悬殊。由此我们可以得出结论:实现算法程序的执行时间可以反映出算法的效率计算法的优劣。
但是不能单靠时间来比较算法的优劣,由于计算机环境的影响,这不是客观准确的,所以提出了时间复杂度。

3、 时间复杂度与大“O”记法

(1) 引入时间复杂度

假定计算机执行算法每一个基本操作的时间是固定的一个时间单位,那么有多少个基本操作就代表会花费多少时间单位,对于不同的机器环境而言,确切的单位时间是不同的,但是对于算法进行多少个基本操作在规模数量级上却是相同的,由此可以忽略机器环境的影响而客观的反应算法的时间效率。
没优化的算法效率:
算法效率:
T=1000100010002
T=N
NN2
T(n)=n^3 * 2
对于算法进行特别具体的细致分析虽然很好。但在实践中的实际价值有限,对于算法的时间性质和空间性质最重要的是其数量及和趋势,这些是分析算法效率的主要部分,而计量算法基本操作数量的规模函数中那些常量因子可以忽略不计。
所以对于没有优化的算法效率可以表示为T(n)=n^3

(2) 大“O”记法

对于单调的整数函数f,如果存在一个整,函数g和实常数c>0,使得对于充分大的n总有f(n)<=c*g(n),就说函数g是f的一个渐进函数(忽略常数),记为f(n)=O(g(n))。也就是说,在趋向无穷的极限意义下,函数f的增长速度受到函数g的约束,既函数f与函数g的特征相似。

(3) 时间复杂度

假设存在函数g,使得算法A处理规模为n的问题示例所用时间为T(n)=O(g(n)), 则称为算法A的渐进时间复杂度,简称时间复杂度,记为T(n)。

4、 最坏时间复杂度

分析算法是存在几种可能的考虑:

  1. 算法完成工作最少需要多少基本操作,即最优时间复杂度
  2. 算法完成工作最多需要多少基本操作,即最坏时间复杂度
  3. 算法完成工作平均需要多少基本操作,即平均时间复杂度

对于最优时间复杂度,其价值不大,因为他没有提供什么有用信息,其反映的只是最乐观最理想的状况,没有参考价值。
对于最坏时间复杂度提供了一种保障。表明算法在此种程度的基本操作中一定能完成工作。
对于平均时间复杂度是对算法的一个全面评价,因此他完整全面的反映了这个算法的性质,但另一方面这种衡量并没有保证,不是每一个算法都能在这个基本操作内完成。而且对于平均情况的计算也会因为应用算法的实力分布可能并不均匀而难以计算。
因此主要关注算法的最坏情况,即最坏时间复杂度.

5、 时间复杂度的几条基本计算规则

(1) 基本操作及只有常数下认为其时间复杂度为O(1)
(2) 顺序结构,时间复杂度按加法进行计算,
(3) 循环结构,时间复杂度按乘法进行计算。
(4) 分支结构,时间复杂度取最大值。
(5) 判断一个算法的效率时,往往只需要关注操作数量的最高次项,其他次要项和常数项可以忽略。
(6) 在没有特殊请说明时,我们所分析的算法的时间复杂度都是指最坏时间复杂度。
例子:
优化后的算法时间复杂度为:
T(n)=nn(1+max(1,0))
=n^2*2
=O(n^2)

# 如果a+b+c=1000,且a^2+b^2=c^2(a,b,c为自然数),如何求出所有a/b/c可能的组合?
import time

start_time=time.time()
for a in range(0,1001):
    for b in range(0,1001):
        c=1000-a-b
        if a**2+b**2==c**2:
            print("a,b,c:%d,%d,%d"%(a,b,c))
end_time=time.time()
print("times:%d"%(end_time-start_time))
print("finished")

6、 常见时间复杂度

在这里插入图片描述

7、 常见时间复杂度之间的关系

在这里插入图片描述

8、 Python内置类型性能分析

(1) Timeit模块

可以用来测试一小段Python代码的执行速度

class timeit.Timer(stmt=’pass’,setup=’pass’,time=)

Timer是测量小段代码执行速度的类
stmt参数是要测试的代码语句(statement)
setup参数是运行代码时需要的设置
timer参数是一个定时器函数,与平台无关。

timeit.Timer.timeit(number=1000000)
Timer类中测试语句执行速度的对象方法。number参数是测试代码时的测试次数,默认为1000000)次。方法返回执行代码的平均耗时,一个float类型的秒数。

from timeit import Timer
# li1=[1,2]
# li2=[23,5]
# li=li1+li2
# li=[i for i in range(10000)]
# li=list(range(10000))

def t1():
    li=[]
    for i in range(10000):
        li.append(i)

def t2():
    li = []
    for i in range(10000):
        li=li +[i]

def t3():
    li=[i for i in range(10000)]
def t4():
    list(range(10000))
def t5():
    li = []
    for i in range(10000):
        li.extend([i])
timer1=Timer("t1()","from __main__ import t1")
print("append:",timer1.timeit(1000))
timer2=Timer("t2()","from __main__ import t2")
print("+:",timer2.timeit(1000))
timer3=Timer("t3()","from __main__ import t3")
print("[i for i in range]:",timer3.timeit(1000))
timer4=Timer("t4()","from __main__ import t4")
print("list(range()):",timer4.timeit(1000))
timer5=Timer("t5()","from __main__ import t5")
print("extend:",timer5.timeit(1000))

def t6():
    li = []
    for i in range(10000):
        li.insert(0,i)
timer6=Timer("t6()","from __main__ import t6")
print("insert{0}:",timer6.timeit(1000))

(2)python封装函数的时间复杂度:

在这里插入图片描述
在这里插入图片描述

9、 数据结构

(1) 概念

数据是一个抽象的概念,将其进行分类后得到程序设计语言中的基本类型。如意int float char等。数据元素之间不是独立的,存在特定的关系。这些关系便是结构。数据结构指数据对象中数据元素之间的关系。
Python给我们提供了很多现成的数据结构类型,这些系统自己定义好的。不需要我们自己去定义的数据结构叫做Python的内置数据结构。比如列表,元组,字典,而这些数据组织方式,Python系统里面没有直接定义,需要我们自己去定义实现这些数据的组织方式。这些数据组织方式称之为Python的扩展数据结构,比如栈、队列等。

(2) 算法与数据结构的区别

数据结构只是静态的描述了数据元素之间的关系,高效的程序需要在数据结构的基础上设计和选择算法。
程序=数据结构+算法
总结:算法是为了解决实际问题而设计的。数据结构是算法需要处理的问题载体。

(3) 抽象数据类型(Abstract Data Type)

抽象数据类型(ADT)的含义是指一个数学模型以及定义在此数学模型上的一组数据。即把数据类型和数据类型上的运算捆在一起进行封装,引入抽象数据类型的目的是把数据类型的表示和数据类型上运算的实现与这些数据类型和运算在程序中的引用隔开,使它们互相独立。
最常用的数据运算有五种:
插入
删除
修改
查找
排序。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值