使用计算机求解数学问题在数据结构,数据结构学习笔记(1)_基础概念

计算机解决问题的步骤:

从具体问题抽象出数学模型

设计一个求解此数学模型的算法

编写程序,进行测试、调度,直到解决问题

数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。

数据(Data):是客观事物的符号表示,是所有能输入到计算机并被计算机程序处理的符号的总称。

数据元素(Data Element):是数据的基本单位,在计算机中通常作为一个整体进行考虑和处理。(有时也被称为元素、结点、记录等)

数据项(Data Item):是组成数据元素的、有独立含义的、不可分割的最小单位。

数据对象(Data Object):是性质相同的数据元素的集合,是数据的一个子集。

数据结构(Data Structure):是相互之间存在的一种或多种特定关系的数据元素的集合。

数据结构:

分为逻辑结构和物理结构两个层次。

数据逻辑结构是从逻辑关系上描述数据,它与数据的存储无关,是独立于计算机的。

数据的逻辑结构可以看作是从具体问题抽象出来的数据模型。

数据的逻辑结构有两个要素:一是数据元素;二是关系;关系是指数据元素间的逻辑关系。通常有四种基本结构。

集合结构:除了“属于同一集合”的关系,别无其他关系。

f7cedf4e674940ffa8f5921273a2d807.png

线性结构:数据元素之间存在一对一的关系。

ffed2f6cdf585384d31171456d1b9d58.png

树形结构:数据元素之间存在一对多的关系。

770bc4f2a80e3285e26e0169f7205705.png

图形结构:数据元素之间存在多对多的关系。

04aeb93c078081c84bb8de57eb543205.png

数据对象在计算机中的存储表示称为数据的存储结构,也称为物理结构。

数据元素在计算机中有两种基本的存储结构,分别是顺序存储结构和链式存储结构。

顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。

0d9049266407f9c18892cb5784e86f1f.png

链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。

b3f56d9318e5ba5c7f74cc0839dce88a.png

数据类型和抽象数据类型:

数据类型(Data Type):是一组性质相同的值的集合及定义在此值集合上的一组操作总称。

在程序设计语言中,每一个数据都属于某种数据类型。类型明显或隐含地规定了数据的取值范围、存储方式以及允许的运算。

对于高级语言来说,一般都有两类数据类型:

原子类型:是不可再分解的基本类型,如整型、浮点型。

结构类型:由若干个类型组合而成,如数组、结构体、类等。

抽象数据类型(Abstract Data Type, ADT):一般指由用户定义的、表示应用问题的数学模型,以及定义在这个模型上的一组操作的总称,具体包括三部分:数据对象,数据对象上关系的集合,以及对数据对象的基本操作的集合。

抽象就是抽取出事物具有的普遍性的本质。

抽象数据类型的标准格式:

ADT 抽象数据类型名

Data

数据元素之间逻辑关系的定义

Operation

操作1

初始条件

操作结果描述

操作2

……

操作n

……

endADT

算法的定义及特性:

算法(Algorithm):是为了解决某类问题而规定的一个有限长的操作序列。

一个算法必须满足五个重要特性:

有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都必须在有穷时间内完成(或者说在可接受的时间内完成)。

确定性:对于每种情况下所就执行的操作,在算法中都有确切的规定,不会产生二义性,使算法的执行者或阅读者都能明确其含义及如何执行。

可行性:算法中所有操作都可以通过已经实现的基本操作运算执行有限次来实现。

输入:一个算法有零个或多个输入。

输出:一个算法有一个或多个输出,它们是算法进行信息加工后得到的结果,一个没有输出的算法就没有意义了。

如何评价算法的优劣:

正确性:在合理的数据输入下,能够在有限的运行时间内得到正确的结果。

可读性:一个好的算法,首先应便于人们的理解和相互交流,其次才是机器可执行性。

健壮性:当输入的数据非法时,好的算法能适当做出正确反应或进行相应处理,而不是产生一些莫名其妙的输出结果。

高效性:高效性包括时间和空间两个方面。时间高效是指算法设计合理,执行效率高,可以用时间复杂度来度量;空间高效是指算法占用存储容量合理,可以用空间复杂度来度量。

事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。

必须依据算法事先编制好程序

时间的比较依赖计算机硬件的软件等环境因素

算法的测试数据设计困难

事前分析估算方法: 在计算机程序编制前,依据统计方法对算法进行估算。

一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:

算法采用的策略、方法

编译产生的代码质量

问题输入规模

机器执行指令的速度

一般来说,一个程序的运行时间,依赖于算法的好坏和问题的输入规模(也就是输入的数据量)。

一个算法的执行时间大致上等于其所有语句执行时间的总和,而语句的执行时间则为该条语句的重复执行次数和执行一次所需时间和乘积。

一条语句的重复执行次数称作语句的频度(Frequency Count)。

算法求解问题的输入量称为问题的规模,一般用整数n表示。问题规模n对不同的问题含义不同。

算法时间复杂度(Time Complexity)是该算法的执行时间,记作T(n),T(n)是该算法所求解问题规模n的函数。当问题的规模n趋向无穷大时, T(n)的数量级称为算法的渐近时间复杂度,记作

T(n) = O(f(n))

它表示随着问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,简称时间复杂度。

输入规模n在没有限制的情况下,只要超过一个数值N,这个函数就总是大于另一个函数,我们称函数是渐近增长的。

函数的渐近增长:给定两个函数f(n)和g(n),如果存在一个整数N,使得对于所有的n>N,f(n)总是比g(n)大,那么,我们说f(n)的增长渐近快于g(n)。

推导大O阶:

用常数1取代运行时间中的所有加法常数

在修改后的运行次数函数中,只保留最高阶项

如果最高阶项存在且不为1,则去除与这个项相乘的常数

得到的结果就是大O阶

确定某个算法的阶次,我们常常需要确定某个特定语句或某个语句集运行的次数。因此,分析算法的复杂度,关键就是要分析循环结构的运行情况。

判断一个算法的效率时,函数的常数和其他次要项常常可以忽略,而更应该关注主项(最高阶项)的阶数。

e4421d03587e06e024dafd208af8080f.png

43ad82382e4057b4d435c8126be7366e.png

算法的时间复杂度不仅和问题的规模大小有关,还与问题数据初始状态有关。

算法在最好情况下的时间复杂度是指算法计算量的最小值,一般没有太大的实际意义。

算法在最坏情况下的时间复杂度是指算法计算量的最大值,一般只会出现在比较极端的情况下,但它可以反映一个算法的“最差表现”。

算法的平均复杂度可能比较难以得到,但它能够比较好的反映一个算法在实际工程应用时的性能。

关于算法的存储空间需求,类似于算法的时间复杂度,一般采用渐近空间复杂度(Space Comolexity)作为算法所需存储空间的量度,简称空间复杂度:

S(n) = O(f(n))

一般情况下,一个程序在机器上执行时,除了需要寄存本身所用的指令、常数、变量和输入数据外,还需要一些对数据进行操作的辅助存储空间。其中对于输入数据所占的具体存储量于问题本身,与算法无关,这样只需分析该算法在实现时所需要的辅助空间就可以了。若算法执行时所需要的辅助空间相对于输入数据量而言是个常数,则称这个算法为“原地工作”,辅助空间为O(1)。

注:截图来自于《大话数据结构》

一、 功能简介 本课件是一个动态演示数据结构算法执行过程的辅助教学软件, 它可适应读者对算法的输入数据和过程执行的控制方式的不同需求, 在计算机的屏幕上显示算法执行过程中数据的逻辑结构或存储结构的变化状况或递归算法执行过程中栈的变化状况。整个系统使用菜单驱动方式, 每个菜单包括若干菜单项。每个菜单项对应一个动作或一个子菜单。系统一直处于选择菜单项或执行动作状态, 直到选择了退出动作为止。 二、 系统内容 本系统内含84个算法,分属13部分内容,由主菜单显示,与《数据结构》教科书中自第2章至第11章中相对应。各部分演示算法如下: 1. 顺序表 (1)在顺序表中插入一个数据元素(ins_sqlist) (2)删除顺序表中一个数据元素(del_sqlist) (3)合并两个有序顺序表(merge_sqlist) 2. 链表 (1)创建一个单链表(Crt_LinkList) (2)在单链表中插入一个结点(Ins_LinkList) (3)删除单链表中的一个结点(Del_LinkList) (4)两个有序链表求并(Union) (5)归并两个有序链表(MergeList_L) (6)两个有序链表求交(ListIntersection_L) (7)两个有序链表求差(SubList_L) 3. 栈和队列 (1)计算阿克曼函数(AckMan) (2)栈的输出序列(Gen、Perform) (3)递归算法的演示  汉诺塔的算法(Hanoi)  解皇后问题的算法(Queen)  解迷宫的算法(Maze)  解背包问题的算法(Knap) (4)模拟银行(BankSimulation) (5)表达式求值(Exp_reduced) 4. 串的模式匹配 (1)古典算法(Index_BF) (2)求Next 函数值(Get_next)和按Next 函数值进行匹配 (Index_KMP(next)) (3)求 Next 修正值(Get_nextval)和按 Next 修正值进行匹配(Index_KMP(nextval)) 5. 稀疏矩阵 (1)矩阵转置 (Trans_Sparmat) (2)快速矩阵转置 (Fast_Transpos) (3)矩阵乘法 (Multiply_Sparmat) 6. 广义表 (1)求广义表的深度(Ls_Depth) (2)复制广义表(Ls_Copy) (3)创建广义表的存储结构(Crt_Lists) 7. 二叉树 (1)遍历二叉树  二叉树的线索化  先序遍历(Pre_order)  中序遍历(In_order)  后序遍历(Post_order) (2) 按先序建二叉树(CrtBT_PreOdr) (3) 线索二叉树  二叉树的线索化  生成先序线索(前驱或后继) (Pre_thre)  中序线索(前驱或后继) (In_thre)  后序线索(前驱或后继) (Post_thre)  遍历中序线索二叉树(Inorder_thlinked)  中序线索树的插入(ins_lchild_inthr)和删除(del_lchild_inthr)结点 (4)建赫夫曼树和求赫夫曼编码(HuffmanCoding) (5)森林转化成二叉树(Forest2BT) (6)二叉树转化成森林(BT2Forest) (7)按表达式建树(ExpTree)并求值(CalExpTreeByPostOrderTrav) 8. 图 (1)图的遍历  深度优先搜索(Travel_DFS)  广度优先搜索(Travel_BFS) (2)求有向图的强连通分量(Strong_comp) (3)有向无环图的两个算法  拓扑排序(Toposort)  关键路径(Critical_path) (4)求最小生成树  普里姆算法(Prim)  克鲁斯卡尔算法(Kruscal) (5)求关节点和重连通分量(Get_artical) (6)求最短路径  弗洛伊德算法(shortpath_Floyd)  迪杰斯特拉算法(shortpath_DIJ) 9. 存储管理 (1)边界标识法 (Boundary_tag_method) (2)伙伴系统 (Buddy_system) (3)紧缩无用单元 (Storage_compactio
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值