算法与数据结构一:基本概念

程序 = 数据结构 + 算法

一、算法的五个特性

算法(algorithm)是解决特定问题求解步骤的描述,在计算机中表现为有限的操作序列。

  • 输入(Input):算法必须有输入量,用以刻画算法的初始条件(特殊情况也可以没有输入量,这时算法本身定义了初始状态);
  • 输出(Output):算法应有一个或以上输出量,输出量是算法计算的结果。没有输出的算法毫无意义。
  • 明确性(Definiteness):算法的描述必须无歧义,以保证算法的实际执行结果是精确地匹配要求或期望,通常要求实际运行结果是确定的。
  • 有限性(Finiteness):算法必须在有限个步骤内完成任务。
  • 有效性(Effectiveness):算法中描述的操作都是可以通过已经实现的基本运算执行有限次来实现(又称可行性)。

二、数据结构

指相互之间存在一种或多种特定关系的数据元素的集合用计算机存储、组织数据的方式。数据结构分别为逻辑结构、(存储)物理结构和数据的运算三个部分。

2.1 逻辑结构

逻辑结构(logical structure) 是指在数据中数据元素之间的相互关系。数据元素之间存在不同的逻辑关系构成了以下4种结构类型。

(1)集合结构:集合的数据元素没有其他关系,仅仅是因为他们挤在一个被称作“集合”的盒子里。

(2)线性结构:线性的数据元素结构关系是一对一的,并且是一种先后的次序,就像a-b-c-d-e-f-g·····被一根线穿连起来,常见的如数组、栈、队列等。

(3)树形结构:树形的数据元素结构关系是一对多的,这就像公司的部门级别,董事长-CEO\CTO-技术部\人事部\市场部…。

(4)图结构:图的数据元素结构关系是多对多的。比如铁路图、公交线路图,一个城市有很多线路连接不同城市。

2.2 存储结构

存储结构(storage structure)也称为物理结构(physical structure),指的是数据的逻辑结构在计算机中的存储形式。数据的存储结构一般可以反映数据元素之间的逻辑关系。分为顺序存储结构和链式存储结构。

(1)顺序存储结构:是把数据元素存放在一组存储地址连续的存储单元里,其数据元素间的逻辑关系和物理关系是一致的。

(2)链式存储结果:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的,数据元素的存储关系并不能反映其逻辑关系,因此需要借助指针来表示数据元素之间的逻辑关系。

2.3 抽象数据类型

抽象数据类型(abstract data type,ADT)是描述具有某种逻辑关系的数据模型,并对在数学模型上进行的一组操作。抽象数据类型描述的是一组逻辑上的特性,与在计算机内部表示无关,计算机中的整数数据类型是一个抽象数据类型,不同处理器可能实现方法不同,但其逻辑特性相同,即加、减、乘、除等运算是一致的。“抽象”的意思是数据类型的数学抽象特性而不是指它们的实现方法。抽象数据类型体现了程序设计中的问题分解、抽象、信息隐藏等特性,可以把现实中的大问题分解为多个规模小且容易处理的小问题,然后建立起一个能被计算机处理的数据,并把每个功能模块的实现细节作为一个独立的单元,从而使具体实现过程隐藏起来。就类似建一栋房子,分成若干个小任务,如地皮规划、图纸设计、施工、装修等,整个过程与抽象数据类型中的问题分解类似。而搬砖人不需要了解图纸设计如何,设计图纸人员不需要了解施工的地基、砌墙的具体细节,装修工人不用关系图纸和搬砖过程,这就是抽象类型中的信息隐藏。

抽象数据类型的概念可能让初学者不太容易理解。例如线性表的抽象数据类型的描述数据对象集合:线性表的数据对象集合为{a1,a2,a3,····,an},每个元素的类型均为DataType。其中,除了第一个元素a1外,每一个元素有且只有一个直接前驱元素;除了最后一个元素an外,每一个元素有且只有一个直接后继元素。数据元素之间的关系是一对一的。

三、时间复杂度

算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。
验证算法的时间复杂度,我们有以下两个方法。

事后统计

一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。所以就有了事后统计的方法。
计算算法的时间复杂度,往往是为了评测算法的性能,设计更好的算法。这就给事后统计的方法带来了两个弊端。

  • 需要先实现算法设计,并至少运行一次。
  • 统计算法时间容易受到计算机硬件、编程语言效率等环境因素影响。

事前分析

在进行算法分析时,语句总是执行次数 T(n) 是关于问题规模 n 的函数。进而分析次数T(n)随规模n的变化情况并确定T(n)的数量级。算法的时间复杂度就是算法的时间度量,记作T(n) = O(f(n))。它表示随问题规模n的增大,算法的执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中,f(n)是问题规模n的某个函数。
为了简便,我们一般在计算时间复杂度往往选取最简单的f(n)表示。例如:O(2n^2+n+1) = O (3n^2+n+3) = O(7n^2+n) = O(n_2) ,一般都只用O(n_2)表示就可以了。
也就是说,两个算法的时间频度不一样,但很有可能拥有相同的时间复杂度。

算法的时间复杂度是衡量一个算法好坏的重要指标。一般情况下,随着规模n的增大,次数T(n)的增长较慢的算法为最优算法。常见时间复杂度从小到大依次排列:
常见时间复杂度比较
常见的算法时间复杂度图示
例如:

(a) 1;      // 时间复杂度为O(1)
(b)for(i =1 ; i<=n ;i++){  x= x+1;}    // 时间复杂度为O(n),称为线性阶
(c)for(i =1 ; i<=n ; i++){
		for(j=1;j<=n;j++){  
			x=x+1; 
		}
	}  // 时间复杂度为O(n²),称为平方阶

时间复杂度的分类

  • 最坏时间复杂度:输入数据状态最不理想情况下的时间复杂度,也就是算法时间复杂度的上界。若没有特别声明,时间复杂度就是指最坏时间复杂度。
  • 平均时间复杂度:在所有可能的输入实例均以等概率出现的情况下,算法的期望时间复杂度。
  • 最好时间复杂度:输入数据状态最理想情况下的时间复杂度。

时间复杂度预估步骤

  1. 找出基本语句:算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。
  2. 计算基本语句的执行次数的数量级:只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可,可以忽略所有低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:增长率。
  3. 用O()表示算法的时间性能:将基本语句执行次数的数量级放入O()中。

时间复杂度分析技巧

  • 简单语句:程序的输入输出、赋值等语句都近似认为需要时间。
  • 顺序结构:需要依次执行一系列语句所用的时间可采用O()的"求和法则",
  • 选择结构:如if语句,它的主要时间耗费是在执行then字句或else字句所用的时间,需注意的是检验条件也需要时间。
  • 循环结构:循环语句的运行时间主要体现在多次迭代中执行循环体以及检验循环条件的时间耗费,一般可用O()的"乘法法则"。
  • 复杂算法:将其分成几个容易估算的部分,然后利用求和法则和乘法法则计算整个算法的时间复杂度。
  • 其他准则
    • g ( n ) = O ( f ( n ) ) g(n)=O(f(n)) g(n)=O(f(n)),则 O ( f ( n ) ) + O ( g ( n ) ) = O ( f ( n ) ) O(f(n))+O(g(n))=O(f(n)) O(f(n))+O(g(n))=O(f(n))
    • O ( C f ( n ) ) = O ( f ( n ) ) O(Cf(n))=O(f(n)) O(Cf(n))=O(f(n)),其中C是一个正常数。

乘法法则: 是指若算法的2个部分时间复杂度分别为 T 1 ( n ) = O ( f ( n ) ) T1(n)=O(f(n)) T1(n)=O(f(n)) T 2 ( n ) = O ( g ( n ) ) T2(n)=O(g(n)) T2(n)=O(g(n)),则 T 1 T 2 = O ( f ( n ) g ( n ) ) T1T2=O(f(n)g(n)) T1T2=O(f(n)g(n))

求和法则:是指若算法的2个部分时间复杂度分别为 T 1 ( n ) = O ( f ( n ) ) T1(n)=O(f(n)) T1(n)=O(f(n)) T 2 ( n ) = O ( g ( n ) ) T2(n)=O(g(n)) T2(n)=O(g(n)),则 T 1 ( n ) + T 2 ( n ) = O ( m a x ( f ( n ) , g ( n ) ) ) T1(n)+T2(n)=O(max(f(n),g(n))) T1(n)+T2(n)=O(max(f(n),g(n)))
特别地,若 T 1 ( m ) = O ( f ( m ) ) T1(m)=O(f(m)) T1(m)=O(f(m)), T 2 ( n ) = O ( g ( n ) ) T2(n)=O(g(n)) T2(n)=O(g(n)),则 T 1 ( m ) + T 2 ( n ) = O ( f ( m ) + g ( n ) ) T1(m)+T2(n)=O(f(m)+g(n)) T1(m)+T2(n)=O(f(m)+g(n))

四、空间复杂度

待更新!!!

算法的时间复杂度和空间复杂度
数据结构与算法——从零开始学习(一)基础概念篇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Roc大鹏君

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值