1.1什么是数据结构
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。但不同的人在使用这个词时所表达的意思有所不同,而数据元素在任何时候都不是孤立存在的而是存在着某种关系,这种数据元素之间的关系成称为结构,根据数据元素之间的不同特性,通常有四种基本结构:
(1)集合 :结构之间除了同属一个集合关系外,别无其他关系
(2)线性结构:结构中的数据元素之间存在一个对一个的关系
(3)树形结构:结构中的数据元素之间存在一个对多个的关系
(4)图状结构或网状结构:数据中的数据元素之间存在多个对多个的关系
1.2基本概念和术语
数据(Data)是对客观事物的符号表示,在计算机科学中始至所有能输入到计算机中并被计算机程序处理的符号的总称。
例如:一个利用数值分析方法解代数方程的程序,其处理对象是整数和实数;一个编译程序或文字处理程序的处理对象是字符串。因此,图像声音等都可以通过编码,都属于数据。
数据元素(Data element)是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理
例如:一本书的数目信息为一个数据元素,而书目的每一项(如书名、作者名等)为一个数据项。数据项是数据的不可分割的最小单位。
数据对象(Data object)是性质相同的数据元素的集合,是数据的一个子集。
例如:整数数据对象是集合N={0,+-1,+-2....},字母字符数据对象是集合C={‘A’,‘B’....'Z'}。
逻辑结构:结构定义中的“关系”描述的是数据元素之间的逻辑关系,又称逻辑结构
存储结构(物理结构):数据结构计算机中的表示(又称映像)
位:在计算机中表示信息的最小单位是二进制数的一位
元素(结点):在计算机中,我们可以用一个由若干位组合起来形成的一个位串表示一个数据元素,通常称这个位串为元素或结点。
数据域:当数据元素由若干数据项组成时,位串中对应各个数据项的子位串称为数据域。
数据元素之间的干系在计算机中有两种不同的表示方法:顺序映像和非顺序映像,并由此得到两种不同的存储结构:顺序存储结构和链式存储结构。
任何一个算法的设计取决于选定的数据(逻辑结构),而算法的实现依赖于采用的存储结构。
数据类型是和数据结构密切相关的一个概念,它最早出现在高级程序语言中,用以刻画(程序)操作对象的特性。是一个值的集合和定义在这个值集上的一组操作的总称。
按值的不同特性,高级程序语言中的数据类型可分为两类:一类是非结构的原子类型:原子类型的值是不可分解的,例如C语言中的基本类型(整型、实型、字符型和枚举型)、指针类型和空类型。另一类是结构类型。
抽象数据类型(Abstract Data Type简称ADT)是只一个数学模型以及定义在该模型上的一组操作。抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关,即不论其内部结构如何变化,只要它的数学特性不变,都不影响其外部的使用。
1.3算法和算法分析
1.3.1算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令表示一个或多个操作;此外,一个算法还具有五个特性
(1)有穷性:一个算法必须总是(对任何合法的输入值)在执行有穷步后结束,且每一步都可在有穷时间内完成。
(2)确定性:算法中每一条指令必须有确切的含义,读者理解时不会产生二义性。并且,在任何条件下,算法只要唯一的一条执行路径,即对于相同的输入只能得出相同的输出。
(3)可行性:一个算法有零个或多个的输入,这些输入取自于某个特定的对象的集合
(4)输入:一个算法有零个或多个的输入,这些输入取字某个特定的对象的集合。
(5)输出:一个算法有一个或多个的输出,这些输出是同输入有着某种特定关系的量。
1.3.2算法设计的要求
设计一个“好”的算法应考虑以下目标
(1)正确性:算法应当满足具体问题的需求。
(2)可读性:算法主要是为了人的阅读和交流。其次才是机器执行。
(3)健壮性:当输入数据非法时,算法也能适当的做出反应或进行处理,而不会产生莫名其妙的输出结果。
(4)效率与低存储量需求:通俗的说,效率指的是算法执行的时间
(5)通用性:算法应具有一般性
1.3.3算法效率的度量
度量一个程序的执行时间通常有两种方法
1、事后统计的方法
2、事前分析估算的方法
(1)依据的算法选用何种策略
(2)问题的规模
(3)书写程序的语言,对于同一个算法,实现语言的级别越高,执行效率就越低
(4)编译程序所产生的机器代码的质量
(5)机器执行指令的速度
一般情况下算法中重读执行的次数是问题规模n的某个函数f(n),算法的时间量度记作 T(n)=O(f(n))
时间复杂度 线性<对数<指数
空间复杂度 S(n)=O(f(n))