博客文章地址:
一、数据结构与算法 - Norni - 博客园www.cnblogs.com![e5442c1b6780881b8149e08e44679330.png](https://img-blog.csdnimg.cn/img_convert/e5442c1b6780881b8149e08e44679330.png)
一、数据结构和算法基础
1.算法的概念
- 算法是独立存在的一种解决问题的方法和思想
- 算法的五大特性:
- 输入:算法具有0个或多个输入
- 输出:算法至少有1个或多个输出
- 有穷性:算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成
- 确定性:算法中的每一步都有确定的含义,不会出现二义性
- 可行性:算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完成
2.算法效率衡量
- 执行时间反应算法效率
- 实现算法程序的执行时间可以反应出算法的效率(在特定计算机环境下),即算法的优劣
- 时间复杂度与‘大O记法’
- ‘大O记法’
对于单调的整数函数f,如果存在一个整数函数g和实常数c>=0,使得对于充分大的n,总有f(n)<=c*g(n),就说函数g是f的一个渐进函数(忽略常数),记为f(n)=O(g(n)),即在趋向无穷的极限意义下,函数f的增长速度受到函数g的约束,亦即函数f与函数g的特征相似 - 时间复杂度
假设存在函数g,使得算法A处理规模为n的问题示例所用时间为T(n)=O(g(n)),则称O(g(n))为算法A的渐近时间复杂度,简称时间复杂度,记为T(n)
- ‘大O记法’
- 最坏时间复杂度
- 最优时间复杂度
- 算法完成工作最少需要多少基本操作
- 最坏时间复杂度
- 算法完成工作最多需要多少基本操作
- 最优时间复杂度
-
- 平均时间复杂度
- 算法完成工作平均需要多少基本操作
- 平均时间复杂度
- 时间复杂度的几条基本计算规则
- 基本操作,即只有常数项,认为其时间复杂度为O(1)
- 顺序结构,时间复杂度按加法进行计算
- 循环结构,时间复杂度按乘法进行计算
- 分支结构,时间复杂度取最大值
- 判断一个算法的效率时,往往只需要关注操作数量的最高次项,其它次要和常数项可以忽略
- 在没有特殊说明时,我们所分析的算法的时间复杂度都是指最坏时间复杂度
3.代码执行时间测量模块itmeit
- timeit模块
timeit模块可以用来测试一小段python代码的执行速度
```python class timeit.Timer(stmt='pass', setup='pass', timer=)
Timer是测量小段代码执行速度的类
stmt参数是要测试的代码语句(statment)
setup参数是运行代码时需要的设置
timer参数是一个定时器函数,与平台有关
timeit.Timer.timeit(number=1000000)
Timer类中测试语句执行速度的对象方法,number参数是测试代码时的测试速度,默认为10000000次
方法返回执行代码的平均耗时,一个float类型的秒数.
import timeit def t(): li = [i for in in range(1000)]
timer_ = timeit.Timer(stmt='t()', setup='from main import t') time_ = timer_.timeit(1000) print(time_) ```
4.数据结构
- 概念
数据结构指数据对象中数据元素之间的关系 - 算法和数据结构的区别
- 数据结构只是静态的描述了数据元素之间的关系
- 高效的程序需要在数据结构的基础上设计和选择算法
- 程序=数据结构+算法
- 算法是为了解决实际问题而设计的,数据结构是算法需要处理的问题载体
5.抽象数据类型(Abstract Data Type)
- 抽象数据类型(ADT)的含义
是指一个数学模型以及定义在此数学模型上的一组操作,即把数据类型和数据类型上的运算捆在一起,进行封装 - 引入抽象数据类型的目的
把数据类型的表示和数据类型上运算的实现与这些数据类型和运算在程序中的引用隔开,使它们互相独立 - 常用的数据运算有五种:
- 插入
- 删除
- 修改
- 查找
- 排序
二、顺序表
- 线性表
一个线性表是某类元素的一个集合,记录着元素之间的一种顺序关系 - 按线性表的实际存储方式,分为两种实现模型
- 顺序表
将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示 - 链表
将元素存放在通过链接构造起来的一系列存储块中
- 顺序表
1.顺序表的形式
- 图解
![2f3c98fe9d4e1b6012b1b1f463c6092a.png](https://img-blog.csdnimg.cn/img_convert/2f3c98fe9d4e1b6012b1b1f463c6092a.png)
-
- 图a
- 表示的是顺序表的基本形式,数据元素本身连续存储,每个元素所占的存储单元大小固定相同
- 元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址Loc(e0)加上逻辑地址(第i个元素)与存储单元大小(c)的乘积计算而得,即Loc(ei)=Loc(e0)+c*i
- 访问指定元素时无需从头遍历,通过计算便可获得对应地址,其时间复杂度为O(1)
- 图b
- 当元素的大小不统一,则须采用图b的元素外置的形式,将实际数据元素另行存储,而顺序表中各单元位置保存对应元素的地址信息(即链接)
- 由于每个链接所需的存储量相同,通过a中总结的公式,可以计算出元素链接的存储地址,而后顺着链接找到实际存储的数据元素
- 此时图中的c不再是数据元素的大小,而是存储一个链接地址所需的存储量,这个量通常很小
- 图a
2.顺序表的结构与实现
- 顺序表的结构
![2f3c98fe9d4e1b6012b1b1f463c6092a.png](https://img-blog.csdnimg.cn/img_convert/2f3c98fe9d4e1b6012b1b1f463c6092a.png)
一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数
- 顺序表的实现
![2f3c98fe9d4e1b6012b1b1f463c6092a.png](https://img-blog.csdnimg.cn/img_convert/2f3c98fe9d4e1b6012b1b1f463c6092a.png)
-
- 图a
- 一体式结构
- 存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的顺序表对象
- 一体式结构整体性强,易于管理,但是由于数据元素存储区域是表对象的一部分,顺序表创建后,元素存储区就固定了
- 图b
- 分离式结构
- 表对象里只保存与整个表有关的信息(即容量和元素个数),实际数据元素存放在另一个独立的元素存储区里,通过链接与基本表对象关联
- 图a
- 元素存储区替换
- 一体式
一体式结构由于顺序表信息区与数据区连续存储在一起,所以当想要更换数据区时,就只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变了 - 分离式
分离式结构若想要更换数据区,只需要将表信息区中的数据区链接地址更新即可,而该顺序表对象不变
- 一体式
- 元素存储区扩充
- 定义
采用分离式结构的顺序表,若将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改.
只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法进行.
把采用这种技术实现的顺序表称为动态顺序表,因为其容量可以在使用中动态变化. - 扩充的两种策略
- 每次扩充增加固定数目的存储位置,如每次扩充增加10个元素位置,这种策略可称为线性增长
特点:节省空间,但是扩充操作频繁,操作次数多 - 每次扩充容量加倍,如每次扩充增加一倍存储空间
特点:减少了扩充操作的执行次数,但可能会浪费空间资源,以空间换时间,推荐的方式
- 每次扩充增加固定数目的存储位置,如每次扩充增加10个元素位置,这种策略可称为线性增长
- 定义
三、链表
- 定义
链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是不像顺序表一样连续存储数据,而是在每一个节点(数据存储单元)里存放下一个节点的位置信息(即地址)
![2f3c98fe9d4e1b6012b1b1f463c6092a.png](https://img-blog.csdnimg.cn/img_convert/2f3c98fe9d4e1b6012b1b1f463c6092a.png)
1.单向链表
- 定义
单向链表也叫单链表,是链表中最简单的一种形式,它的每个节点包含两个域,一个信息域(元素域)和一个链接域,这个链接指向链表中的下一个节点,而最后一个节点的链接域则指向一个空值.
![2f3c98fe9d4e1b6012b1b1f463c6092a.png](https://img-blog.csdnimg.cn/img_convert/2f3c98fe9d4e1b6012b1b1f463c6092a.png)
-
- 表元素域elem用来存放具体的数据
- 链接域next用来存放下一个节点的位置(python中的标识)
- 变量p指向链表的头节点(首节点)的位置,从p出发能找到列表中的任意节点
- 节点实现
python class SingleNode(object): """单链表的节点""" def __init__(self, item): # item存放数据元素 self.item = item # next是下一个节点的标识 self.next = None
- 单链表的操作
- is_empty()链表是否为空
- length()链表长度
- travel()遍历整个链表
- add(item)链表头部添加元素
- append(item)链表尾部添加元素</