数据结构(一)

数据结构

定义

数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。

研究对象

数据逻辑结构

1.集合:数据结构中的元素之间除了“同属一个集合” 的相互关系外,别无其他关系。
2.线性结构:数据结构中的元素存在一对一的相互关系。
3.树形结构:数据结构中的元素存在一对多的相互关系。
4.图形结构:数据结构中的元素存在多对多的相互关系。

数据存储结构

常用的存储结构有顺序存储、链式存储、索引存储和哈希存储等。
顺序存储结构(顺序存储)的特点是:借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系。
非顺序存储(链式存储)的特点是:借助指示元素存储地址的指针表示数据元素之间的逻辑关系。

分类

数据结构有很多种,一般来说,按照数据的逻辑结构对其进行简单的分类,包括线性结构和非线性结构两类。

线性结构

简单地说,线性结构就是表中各个结点具有线性关系。如果从数据结构的语言来描述,线性结构应该包括如下几点:
1、线性结构是非空集。
2、线性结构有且仅有一个开始结点和一个终端结点。
3、线性结构所有结点都最多只有一个直接前驱结点和一个直接后继结点。
线性表就是典型的线性结构,还有栈、队列和串等都属于线性结构。

非线性结构

简单地说,非线性结构就是表中各个结点之间具有多个对应关系。如果从数据结构的语言来描述,非线性结构应该包括如下几点:
1、非线性结构是非空集。
2、非线性结构的一个结点可能有多个直接前驱结点和多个直接后继结点。
在实际应用中,数组、广义表、树结构和图结构等数据结构都属于非线性结构。

常用的数据结构

在计算机科学的发展过程中,数据结构也随之发展。程序设计中常用的数据结构包括如下几个。

数组(Array)

数组是一种聚合数据类型,它是将具有相同类型的若干变量有序地组织在一起的集合。数组可以说是最基本的数据结构,在各种编程语言中都有对应。一个数组可以分解为多个数组元素,按照数据元素的类型,数组可以分为整型数组、字符型数组、浮点型数组、指针数组和结构数组等。数组还可以有一维、二维以及多维等表现形式。

栈( Stack)

栈是一种特殊的线性表,它只能在一个表的一个固定端进行数据结点的插入和删除操作。栈按照先进后出或后进先出的原则来存储数据,也就是说,先插入的数据将被压入栈底,最后插入的数据在栈顶,读出数据时,从栈顶开始逐个读出。栈在汇编语言程序中,经常用于重要数据的现场保护。栈中没有数据时,称为空栈。

队列(Queue)

队列和栈类似,也是一种特殊的线性表。和栈不同的是,队列只允许在表的一端进行插入操作,而在另一端进行删除操作。一般来说,进行插入操作的一端称为队尾,进行删除操作的一端称为队头。队列中没有元素时,称为空队列。

链表( Linked List)

链表是一种数据元素按照链式存储结构进行存储的数据结构,这种存储结构具有在物理上存在非连续的特点。链表由一系列数据结点构成,每个数据结点包括数据域和指针域两部分。其中,指针域保存了数据结构中下一个元素存放的地址。链表结构中数据元素的逻辑顺序是通过链表中的指针链接次序来实现的。

树( Tree)

树是典型的非线性结构,它是包括,2个结点的有穷集合K。在树结构中,有且仅有一个根结点,该结点没有前驱结点。在树结构中的其他结点都有且仅有一个前驱结点,而且可以有两个后继结点,m≥0。
图(Graph)
图是另一种非线性数据结构。在图结构中,数据结点一般称为顶点,而边是顶点的有序偶对。如果两个顶点之间存在一条边,那么就表示这两个顶点具有相邻关系。

堆(Heap)

堆是一种特殊的树形数据结构,一般讨论的堆都是二叉堆。堆的特点是根结点的值是所有结点中最小的或者最大的,并且根结点的两个子树也是一个堆结构。

散列表(Hash)

散列表源自于散列函数(Hash function),其思想是如果在结构中存在关键字和T相等的记录,那么必定在F(T)的存储位置可以找到该记录,这样就可以不用进行比较操作而直接取得所查记录。

常用算法

(1)检索。检索就是在数据结构里查找满足一定条件的节点。一般是给定一个某字段的值,找具有该字段值的节点。
(2)插入。往数据结构中增加新的节点。
(3)删除。把指定的结点从数据结构中去掉。
(4)更新。改变指定节点的一个或多个字段的值。
(5)排序。把节点按某种指定的顺序重新排列。例如递增或递减。

数据结构与算法的关系

算法的设计: 取决于(数据结构里)选定的逻辑结构
算法的实现: 依赖于(数据结构里)采用的存储结构 (数组还是链表)

算法的特性

(1)有穷性 //算法的执行步骤是有限的  	
(2)确定性 //算法的每一个步骤,无二义性 ,没有歧义 	
(3)可行性 //算法能够在有限的时间内完成 	
(4)输入 //一个算法可以有一个或多个输入	
(5)输出 //一个算法可以有一个或多个输出

如何评价一个算法的好坏

 正确性:保证算法是可以正确完成功能的实现
 易读性:容易被解读  
 健壮性:容错(错误)处理
 高效性:执行效率,通过可执行语句重复执行次数来衡量算法是否高效 。(时间复杂度)
 低存储性:占用空间小 (空间复杂度)

时间复杂度(程序运行的速度)

算法的可执行语句重复执行的次数-》频度和	
 语句频度:算法中可执行语句的重复执行的次数
 通常时间复杂度用一个问题规模函数来表达	
 T(n) = O(f(n))
 T(n)	//问题规模的时间函数
 n		//代表的是问题的规模 输入数据量的大小  举例  对一个int a[100];进行冒泡排序      	  100 ==== n
 O		//时间数量级
 f(n)	//算法的可执行语句重复执行的次数  用问题规模n的某个函数f(n)来表达
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值