数据结构绪论——小结

1.1 数据结构在程序设计中的作用

图灵奖获得者沃思给出的著名公式;数据结构+算法=程序
计算机解决任何问题都必须依靠程序设计



                                                               程序设计的一般步骤


1.2主要内容

问题-->抽象出问题的模型——>求模型的解

【问题】:数值问题、非数值问题

                      数值问题——.数学方程

                      非数值问题——数据问题


非数值问题的数据组织和处理,主要内容如下:

(1)数据的逻辑结构:线性表、树、图等数据结构,其核心是如何组织待处理的数据以及数据之间的关系;

(2)数据的存储结构:如何将线性表、树、图等数据结构存储到计算机的存储器中,其核心是如何有效地存储数据以及数据之间的逻辑关系;

(3)算法:如何基于数据的某种存储结构实现插入、删除、查找等基本操作,其核心是如何有效地处理数据;

(4)常用数据处理技术:查找技术、排序技术、索引技术等。


1.3数据结构的基本概念

数据 :所有能 输入 到计算机中并能被计算机程序 识别和处理 的符号集合。

            数值数据:整数、实数等

            非数值数据:图形、图象、声音、文字等

数据元素 :数据的 基本 单位,在计算机程序中通常作为一个 整体 进行考虑和处理。
数据项 :构成数据元素的不可分割的最小单位。

数据结构:相互之间存在一定关系数据元素的集合。

数据、数据元素、数据项之间的关系

包含关系:数据由数据元素组成,数据元素由数据项组成。
数据元素是讨论数据结构时涉及的最小数据单位,其中的数据项一般不予考虑。
数据(——>数据元素)结构(——>关系)

按照视点的不同,数据结构分为逻辑结构和存储结构


逻辑结构:指数据元素之间 逻辑关系 的整体。——> 关联方式或邻接关系

数据的逻辑结构是从具体问题抽象出来的数据模型

数据的逻辑结构在形式上可定义为一个二元组:

Data_Structure = (D, R)

其中 D 是数据元素的有限集合, R D 上关系的集合


Data_Structure = (D, R)

其中D = {A,B,C,D,E,F,G}

R = {R1},R1 = {<A,B>, <A,E>, <A,F>, <B,C>, <B,D>, <C,D>, <D,E>, <D,G>, <E,F>, <E,G>}

存储结构:又称为物理结构,是数据及其逻辑结构在 计算机 中的表示。——>内存

                   存储结构实质上是内存分配,在具体实现时依赖于计算机语言。

数据结构从逻辑上分为四类:

⑴集合:数据元素之间就是“属于同一个集合” ;

⑵线性结构:数据元素之间存在着一对一的线性关系;

⑶树结构:数据元素之间存在着一对多的层次关系;

⑷图结构:数据元素之间存在着多对多的任意关系。

通常有两种存储结构:

1.顺序存储结构:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。


2.链接存储结构:用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示 。


数据的逻辑结构属于用户视图,是面向问题的,反映了数据内部的构成方式;数据的存储结构属于具体实现的视图,是面向计算机的。
一种数据的逻辑结构可以用多种存储结构来存储,而采用不同的存储结构,其数据处理的效率往往是不同的。

抽象数据类型

1. 数据类型Data Type):一组的集合以及定义于这个值集上的一组操作的总称。

      例如:C++中的整型变量 

2. 抽象Abstract:抽出问题本质的特征而忽略非本质的细节。

     例如:地图、驾驶汽车

3. 抽象数据类型Abstract Data TypeADT:一个数据结构以及定义在该结构上的一组操作的总称。 

在设计ADT时,把ADT的定义、设计和实现分开来。定义部分只包含数据的逻辑结构和所允许的操作集合,一方面,ADT的使用者依据这些定义来使用ADT,即通过操作集合对该ADT进行操作;另一方面,ADT的实现者依据这些定义来完成该ADT各种操作的具体实现。

 

ADT 抽象数据类型名

Data

    数据元素之间逻辑关系的定义

Operation
    操作1
        前置条件:执行此操作前数据所必须的状态 
          输        入:执行此操作所需要的输入
          功        能:该操作将完成的功能
          输        出:执行该操作后产生的输出
          后置条件:执行该操作后数据的状态
   操作2
            ……
   ……
   操作n
          ……
endADT



1.4 算法及其算法的分析

算法的相关概念

1.算法(Algorithm):是对特定问题求解步骤的一种描述,是指令有限序列

2.算法的五大特性:

⑴ 输入:一个算法有零个或多个输入。

输出:一个算法有一个或多个输出。

有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。

确定性:算法中的每一条指令必须有确切的含义,对于相同的输入只能得到相同的输出。

可行性:算法描述的操作可以通过已经实现的基本操作执行有限次来实现。

算法的四种描述

一、算法的描述方法——自然语言 

优点:容易理解
缺点:冗长、二义性
使用方法:粗线条描述算法思想
注意事项:避免写成自然段

二、算法的描述方法——流程图 

优点:流程直观
缺点:缺少严密性、灵活性
使用方法:描述简单算法
注意事项:注意抽象层次

三、算法的描述方法——程序设计语言

优点:能由计算机执行
缺点:抽象性差,对语言要求高
使用方法:算法需要验证
注意事项:将算法写成子函数

四、算法的描述方法——伪代码 

伪代码(Pseudocode):介于自然语言和程序设计语言之间的方法,它采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。

优点:表达能力强,抽象性强,容易理解

使用方法:7 ± 2

算法分析

度量算法效率的方法:

事后统计:将算法实现,测算其时间和空间开销。

缺点:⑴ 编写程序实现算法将花费较多的时间和精力;

            ⑵ 所得实验结果依赖于计算机的软硬件等环境因素。

事前分析:对算法所消耗资源的一种估算方法。 

算法分析(Algorithm Analysis):对算法所需要的计算机资源——时间空间进行估算。

      时间复杂性(TimeComplexity)

      空间复杂性(SpaceComplexity)

算法的时间复杂度分析


问题规模:输入量的多少。

基本语句:是执行次数与整个算法的执行次数成正比的操作指令。

算法分析——O符号

定义 若存在两个正的常数cn0,对于任意nn0,都有T(n)≤c×f(n),则称T(n)=O(f(n))


问题规模充分大时在渐近意义下的阶。

定理:若A(n)=amnm+am-1nm-1+¼+a1n+a0是一个m次多项式,则A(n)=O(nm)

说明:在计算算法时间复杂度时,可以忽略所有低次幂和最高次幂的系数

如果问题规模相同,时间代价与输入数据有关,则需要分析最好情况、最坏情况、平均情况。

最好情况:出现概率较大时分析
最差情况:实时系统
平均情况:已知输入数据是如何分布的, 通常假设等概率分布






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值