【第1章 数据结构概述】

目录

一. 基本概念

1. 数据、数据元素、数据对象

2. 数据结构

二. 数据结构的分类

1. 数据的逻辑结构可分为两大类:a. 线性结构;b. 非线性结构

2. 数据的存储结构取决于四种基本的存储方法:顺序存储、链接存储、索引存储、散列存储

3. 数据的运算

三. 数据类型

1. 基本类型、组合类型

2. 抽象数据类型

四. 算法和算法分析

1. 算法概念

2. 算法分析


一. 基本概念

1. 数据、数据元素、数据对象

数据:客观事物的符号表示,对现实世界的事物采用计算机能够识别、存储和处理的形式进行描述的符号的集合。

数据元素:数据的基本单位,可以由若干数据项组成。其中数据项包括:初等项(数据不可分割的最小单位;组合项:由若干数据项组成)

数据对象:性质相同的数据元素的集合。如:整数集合,学生信息表

例1:学生信息表问题

 每一行是一个学生的相关信息,即学生个体,则是一个数据元素;

学号、姓名、性别等信息,为数据项,其中成绩为组合项,学号为初等项;

学生情况表则是一个数据对象。

例2:社交网问题

2. 数据结构

数据的结构由数据对象以及该对象中数据之间的关系组成。一个数据结构可以描述为一个二元组:

Data Structure = (D, R),其中D是数据对象,R是该数据对象中数据元素之间关系的集合,这里描述的是数据的逻辑结构。 

逻辑关系的表示:用<di, dj>表示数据元素di、dj的先后关系,称di为dj的前驱,dj为di的后继,(D, R)中的R即为类似的<di, dj>的二元关系的集合。

例如:

数据的逻辑结构图:用结点表示数据元素,结点间的连线表示数据元素间的关系。

数据结构一般认为包括以下三个方面:

(1)逻辑结构:数据元素与数据元素之间的逻辑关系;

(2)存储结构(物理结构):数据元素与数据元素之间的关系在计算机中的存储表示;

(3)数据的运算:对数据的操作。如检索、插入、排序等。

二. 数据结构的分类

1. 数据的逻辑结构可分为两大类:a. 线性结构;b. 非线性结构

(1)线性结构

有且仅有一个开始结点和终端结点,并且所有结点最多只有一个前驱和一个后继。

例如:线性表就是典型的线性结构。

(2)非线性结构

一个结点可能有多个前驱和后继。

树:一个结点最多只有一个前驱,而可以有多个后继

图:对结点的前驱和后继的个数不作限制-------------最一般的非线性结构

2. 数据的存储结构取决于四种基本的存储方法:顺序存储、链接存储、索引存储、散列存储

(1)顺序存储:把逻辑上相邻的结点存储在物理位置相邻的存储单元里,结点之间的逻辑关系用存储单元的邻接关系来体现。

注意:

  • 顺序存储主要用于线性结构,但是非线性结构也可以通过线性化的方法实现顺序存储
  • 通常顺序存储用程序语言的数组描述

(2)链接存储:对逻辑上相邻的结点不要求在存储的物理位置上也相邻,结点之间的逻辑关系由附加的指针表示。

注意:

  • 链接存储常用于非线性结构,但线性结构也可以链接存储
  • 通常链接存储用程序语言的指针描述

(3)索引存储:在存储结点数据的同时,还建立附加的索引表。索引表的每一项称为索引项。一般索引项由关键字(唯一标识该结点的数据项)和地址(结点的存储地址)组成。

(4)散列存储:根据结点的关键字计算出该结点的存储地址,然后按存储地址存放该关键字对应的数据元素。数据元素di的存储地址为:ai = h(di.key),h为散列函数,di.key为di的关键字。

 注意:

  • 同一种逻辑结构采用不同的存储方法,可得到不同的存储结构
  • 通常将同一逻辑结构的不同存储结构用不同的名称标识,如:
  1. 线性表的顺序存储称为顺序表;
  2. 线性表的链接存储称为链表
  3. 线性表的散列存储称为散列表

3. 数据的运算

同一种逻辑结构,采用同一种存储方式,如果定义的运算不同,也用不同的名称标识。如:

  • 栈:线性表插入、删除操作限制在表的一端;
  1. 若该线性表为顺序存储,则称为顺序栈;
  2. 若该线性表链式存储,则称为链式栈。
  • 队列:线性表的插入限制在表的一端,删除限制在表的另一端
  1. 若该线性表为顺序存储,则称为顺序队列;
  2. 若该线性表为链式存储,则称为链式队列。

综述:数据的逻辑结构 + 数据的存储结构 + 数据的运算 = 数据结构

三. 数据类型

1. 基本类型、组合类型

高级程序语言中,数据类型分为两种:

(1)基本数据类型:其取值范围,允许的操作,由系统预先规定;

(2)组合类型:由基本类型组合构造.

2. 抽象数据类型

Abstract Data Type,ADT,指抽象数据的组织和与之相关的操作,即将数据和操作封装在一起

------数据的逻辑结构以及在逻辑结构上定义的操作。

使得用于程序只能通过在ATD里定义的某些操作来访问其中的数据,从而实现信息隐蔽。

例如:

 

四. 算法和算法分析

1. 算法概念

定义:一个有穷的指令集,这些指令为解决某一特定任务规定了一个运算系列。

算法的五大特性:

(1)输入:一个算法必须有一个或多个输入(通过输入,使得任务开始,从而算法启动有了意义),这里不同于程序的特性;

(2)输出:一个算法应该有一个或多个输出;

(3)确定性:无歧义,每一种情况,需执行的动作要严格、清晰规定;

(4)有穷性:有限个步骤结束;

(5)可行性:可通过基本操作执行完成。

2. 算法分析

一个好的算法应满足下述要求:

(1)正确性;

(2)可读性;

(3)健壮性:输入非法数据,能做出反应或处理,输出错误信息并终止执行;

(4)时间复杂度:时间效率;

(5)空间复杂度:存储占用量

时间开销往往和空间开销相互制约,需折中处理。

1. 语句执行时间之和

算法的运行时间是该算法各语句执行时间之和,每条语句的执行时间是该语句的执行次数与执行一次所需时间之积。

一个算法在计算机上运行消耗的时间取决于多种因素:算法的策略、求解问题的规模、程序设计语言的级别、编译程序的优劣、机器运行的速度等。

所以,通过机器运行时间来衡量算法的时间效率是不妥的。

衡量算法的时间效率应该独立于计算机软、硬件因素。可以认为一个特定算法“运行工作量”的大小只依赖于问题的规模,或者问题规模的函数。一般将求解问题的输入量作为问题的规模,用n表示。

2. 算法的时间复杂度是指算法中各条语句的执行次数之和。T(n) = f(n),其中f(n)是算法所求解问题规模n的函数,当n趋于无穷大时,时间复杂度T(n)的数量级(阶)称为算法的渐进时间复杂度。即T(n) = O(f(n)).

有时,算法的时间复杂度不仅仅依赖于问题的规模,还与输入实例的初始化状态有关。

时间复杂度的精确表示经常是困难的,因此通常采用渐进时间复杂度,往往简称时间复杂度。

常见的时间复杂度,按数量级递增排列,有O(1) <<O(log2n)<<O(n)<<O(nlog2n)<<O(n^2)<<O(n^3)...<<O(n^k)<<O(2^n)

3. 空间复杂度指所需存储空间的耗费,记为S(n) = O(f(n)),其中n为问题规模,f(n)为算法所处理的数据所需的存储空间与算法操作所需辅助空间之和。

归纳:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值