初识(C/C++)数据结构(一)绪论

第一章 绪论

在这里插入图片描述

1.1 数据结构的基本概念

1. 数据

        数据是信息的载体,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。例如,整数、实数和字符串都是数据。

2. 数据元素

        数据元素是数据的基本单位,通常作为一个整体进行考虑和处理,通常是数据结构这门课中讨论的最小单位一个数据元素可由若干个数据项组成,数据项是构成数据元素的不可分割的最小单位,例如,在学生管理系统中,学生记录就是一个数据元素,它由学号、姓名,性别等数据项组成。

3. 数据对象

        数据对象是具有相同性质的数据元素的集合,是数据的一个子集。

例如,整数数据对象是集合N= {0, +1,-1, +2,-2…}。

4. 数据类型

        数据类型是一个值的集合和定义在此集合上的一组操作的总称。
1>原子类型。其值不可再分的数据类型。

2>结构类型。其值可以再分解为若干成分(分量)的数据类型。

3>抽象数据类型。抽象数据组织及与之相关的操作。

5. 数据结构

        数据结构是相互之间存在一种或多种特定关系的数据元素的集合。 在任何问题中,数据元素都不是孤立存在的,它们之间存在某种关系,这种数据元素相互之间的关系称为结构( Structure)。数据结构包括三方面的内容:逻辑结构、存储结构和数据的运算。

        数据的逻辑结构和存储结构是密不可分的两个方面,一个算法的设计取决于所选定的逻辑结构,而算法的实现依赖于所采用的存储结构。

数据结构三要素

        1. 数据的逻辑结构:

        逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据.它与数据的存储无关,是独立于计算机的。数据的逻辑结构分为线性结构非线性结构线性表是典型的线性结构;集合、树和图是典型的非线性结构。数据的逻辑结构分类如图1.1所示。

在这里插入图片描述

        集合。结构中的数据元素之间除“同属一个集合”外,别无其他关系,如图1.2(a)所示。

        线性结构。结构中的数据元素之间只存在一对一的关系,如图1.2(b)所示。简单地说,线性结构是一个数据元素的有序(次序)集合。它有以下4个基本特征:

        1. 集合中必存在唯一的一个“第一个元素”。

        2. 集合中必存在唯一的一个“最后一个元素”。

        3. 除最后一个元素之外,其他数据元素均有唯一的“后继”。

        4. 除第一个元素之外,其他数据元素均有唯一的“前驱”。

         数据结构中,线性结构是指数据元素之间存在着“一对一”的线性关系的数据结构。例如,(a1, a2, a3,… an), a1为第一个元素,an 为最后一个元素,此集合即为一个线性结构的集合。

        非线性结构:与线性结构不同,非线性结构中的结点存在着一对多的关系,它又可以细分为树形结构和图形结构。

        树形结构:结构中的数据元素之间存在一对多的关系, 如图1.2©所示。

        图状结构或网状结构。结构中的数据元素之间存在多对多的关系,如图1.2(d)所示。

在这里插入图片描述

        2. 数据的存储结构

         存储结构是指数据结构在计算机中的表示(又称映像),也称物理结构。它包括数据元素的表示和关系的表示。数据的存储结构是用计算机语言实现的逻辑结构,它依赖于计算机语言。数据的存储结构主要有顺序存储、链式存储、索引存储和散列存储。

        (1)顺序存储方法

        顺序存储方法是存储结构类型中的一种,该方法是把逻辑上相邻的结点存储在物理位置上相邻的存储单元中,结点之间的逻辑关系由存储单元的邻接关系来体现。由此得到的存储结构称为顺序存储结构,通常顺序存储结构是借助于计算机程序设计语言(如C/C++)的数组来描述的。

        (2)链式存储方法

        链式存储方法不要求逻辑上相邻的结点在物理位置上也相邻,结点间的逻辑关系是由附加的指针字段表示的。由此得到的存储结构表示称为链式存储结构,通常借助于计算机程序设计语言(如C/C++)的指针类型来描述它。

        (3)索引存储方法

        索引存储方法在存储结点信息时除建立存储结点信息外,还建立附加的索引表来标识结点的地址。索引项的一般形式是<关键字,地址>。 关键字标识唯一个结点,地址作为指向结点的指针。

        (4)散列存储方法

        散列存储方法的基本思想是根据结点的关键字通过散列函数直接计算出该结点的存储地址。这种存储方法本质上是顺序存储方法的扩展。

1.2 算法的基本概念

1. 算法

        算法可以理解为由基本运算及规定的运算顺序所构成的完整的解题步骤,或者看成按照要求设计好的有限的确切的计算序列。

2. 算法的特性

        一个算法应该具有以下5个重要的特征。

(1)有穷性

        一个算法必须保证执行有限步之后结束。

(2)确定性

        算法的每-步骤必须有确定的定义。

(3)输入

        一个算法有0个或多个输入,以刻画运算对象的初始情况。所谓0个输入是指算法本身确定了初始条件。

(4)输出

        一个算法有一个或多个输出,以反映对输入数据加工后的结果。没有输出的算法是毫无意义的。

(5)可行性

        算法中的所有操作都必须通过已经实现的基本操作进行运算,并在有限次内实现,而且人们用笔和纸做有限次运算后也可完成。

3. 算法的设计目标

        算法设计目标包括正确性、可读性、健壮性和算法效率4个方面,其中算法效率通过算法的时间复杂度和空间复杂度来描述。

(1)正确性

        要求算法能够正确地执行预先规定的功能和性能要求。这是最重要也是最基本的标准。

(2)可读性

        要求算法易于人的理解。

(3)健壮性

        要求算法有很好的容错性,能够对不合理的数据进行检查。

(4)高效率与低存储量需求

        算法的效率主要是指算法的执行时间。对于同一个问题如果有多种算法可以求解,执行时间短的算法效率高。算法的存储量是指算法执行过程中所需要的最大存储空间。高效率和低存储量这两者都与问题的规模有关。

1.3 算法的度量

        算法效率的度量是通过时间复杂度空间复杂度来描述的。

1. 时间复杂度

        一个语句的频度是指该语句在算法中被重复执行的次数。算法中所有语句的频度之和记为T(n),它是该算法问题规模n的函数,时间复杂度主要分析T(n)的数量级。算法中基本运算(最深层循环内的语句)的频度与T(n)同数量级,因此通常采用算法中基本运算的频度 f(n)来分析算法的时间复杂度”。因此,算法的时间复杂度记为

T(n) = O(f(n))

式中,O的含义是T(n)的数量级,其严格的 数学定义是:若T(n)和fn)是定义在正整数集合上的两个函数,则存在正常数C和n0,使得当n ≥ n0时,都满足0 ≤ T(n) ≤ Cf(n)。

        算法的时间复杂度不仅依赖于问题的规模n,也取决于待输入数据的性质(如输入数据元素的初始状态)。例如,在数组[A…n-1]中,查找给定值k的算法大致如下:
        (1) i=n-1;

        (2) while(i>=0&&(A[i] !=k))

        (3) i–;

        (4) return i;

该算法中语句3 (基本运算)的频度不仅与问题规模n有关,而且与输入实例中A的各元素的取值及k的取值有关:

        ①若A中没有与k相等的元素,则语句3的频度f(n)= n。

        ②若A的最后- -个元素等于k,则语句3的频度f(n)是常数0。

        最坏时间复杂度是指在最坏情况下,算法的时间复杂度。

        平均时间复杂度是指所有可能输入实例在等概率出现的情况下,算法的期望运行时间。

        最好时间复杂度是指在最好情况下,算法的时间复杂度。

        一般总是考虑在最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长,在分析一个程序的时间复杂性时,有以下两条规则:

        a)加法规则

T(n)= T1(n) + T2(n)=O(f(n)) + O(g(n)) = O(max(n), g(n)))

        b)乘法规则

T(n) = T1(n)xT2(n) = O(f(n))xO(g(n)) = O(n)xO(g(n))

        常见的渐近时间复杂度为

O(1)< O( l o g 2 n log_{2}n log2n) < O(n) < O( n l o g 2 n nlog_2n nlog2n) < O( n 2 n^2 n2)< O( n 3 n^3 n3) < O( 2 n 2^n 2n) < O(n!) < O( n n {n^{n}} nn)

2. 空间复杂度

        算法的空间复杂度S(n)定义为该算法所耗费的存储空间,它是问题规模n的函数。记为

S(n) = O(g(n))

        一个程序在执行时除需要存储空间来存放本身所用的指令、常数、变量和输入数据外,还需要一些对数据进行操作的工作单元和存储一些为实现计算所需信息的辅助空间。若输入数据所占空间只取决于问题本身,和算法无关,则只需分析除输入和程序之外的额外空间。

        算法原地工作:是指算法所需的辅助空间为常量,即O(1)。

注:取f(n)中随n增长最快的项,将其系数置为1作为时间复杂度的度量。例如,f(n)=a n 3 n^3 n3+ b n 2 n^2 n2+ cn的时间复杂度为O( n 3 n^3 n3)。

部分资源来源于网络,如有侵权,请联系本人予以删除!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值