程序员必须知道的 8 种数据结构

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

编者荐语

 

数据结构是一种特殊的组织和存储数据的方式,可以使我们可以更高效地对存储的数据执行操作。数据结构在计算机科学和软件工程领域具有广泛而多样的用途。

链接丨http://suo.im/6oo92L

快速介绍8种常用数据结构

ddeb44cc62f90ee44dca890fbced233b.jpeg

几乎所有已开发的程序或软件系统都使用数据结构。此外,数据结构属于计算机科学和软件工程的基础。当涉及软件工程面试问题时,这是一个关键主题。因此,作为开发人员,我们必须对数据结构有充分的了解。

在本文中,我将简要解释每个程序员必须知道的8种常用数据结构。

1.数组

数组是固定大小的结构,可以容纳相同数据类型的项目。它可以是整数数组,浮点数数组,字符串数组或什至是数组数组(例如二维数组)。数组已建立索引,这意味着可以进行随机访问。

8b252a8c4b1ec87e89c888778a9528e5.jpeg

Fig 1. Visualization of basic Terminology of Arrays

数组运算

· 遍历:遍历所有元素并进行打印。

· 插入:将一个或多个元素插入数组。

· 删除:从数组中删除元素

· 搜索:在数组中搜索元素。您可以按元素的值或索引搜索元素

· 更新:在给定索引处更新现有元素的值

数组的应用

· 用作构建其他数据结构的基础,例如数组列表,堆,哈希表,向量和矩阵。

· 用于不同的排序算法,例如插入排序,快速排序,冒泡排序和合并排序。

2.链表

链表是一种顺序结构,由相互链接的线性顺序项目序列组成。因此,您必须顺序访问数据,并且无法进行随机访问。链接列表提供了动态集的简单灵活的表示形式。

让我们考虑以下有关链表的术语。您可以通过参考图2来获得一个清晰的主意。

· 链表中的元素称为节点。

· 每个节点都包含一个密钥和一个指向其后继节点(称为next)的指针。

· 名为head的属性指向链接列表的第一个元素。

· 链表的最后一个元素称为尾。

934febc39d650aa271b8e581b6f5f23c.jpeg

Fig 2. Visualization of basic Terminology of Linked Lists

以下是可用的各种类型的链表。

· 单链列表—只能沿正向遍历项目。

· 双链表-可以在前进和后退方向上遍历项目。节点由一个称为上一个的附加指针组成,指向上一个节点。

· 循环链接列表—链接列表,其中头的上一个指针指向尾部,尾号的下一个指针指向头。

链表操作

· 搜索:通过简单的线性搜索在给定的链表中找到键为k的第一个元素,并返回指向该元素的指针

· 插入:在链接列表中插入一个密钥。插入可以通过3种不同的方式完成;在列表的开头插入,在列表的末尾插入,然后在列表的中间插入。

· 删除:从给定的链表中删除元素x。您不能单步删除节点。删除可以通过3种不同方式完成;从列表的开头删除,从列表的末尾删除,然后从列表的中间删除。

链表的应用

· 用于编译器设计中的符号表管理。

· 用于在使用Alt Tab(使用循环链表实现)的程序之间进行切换。

3.堆栈

堆栈是一种LIFO(后进先出-最后放置的元素可以首先访问)结构,该结构通常在许多编程语言中都可以找到。该结构被称为"堆栈",因为它类似于真实世界的堆栈-板的堆栈。

95de0d0807b04ea56742b7d5a2c8f037.jpeg

Image Source: pixabay

堆栈操作

下面给出了可以在堆栈上执行的2个基本操作。请参考图3,以更好地了解堆栈操作。

· Push 推送:在堆栈顶部插入一个元素。

· Pop 弹出:删除最上面的元素并返回。

62d7ad1a147b983576881ee59ca4399b.jpeg

Fig 3. Visualization of basic Operations of Stacks

此外,为堆栈提供了以下附加功能,以检查其状态。

· Peep 窥视:返回堆栈的顶部元素而不删除它。

· isEmpty:检查堆栈是否为空。

· isFull:检查堆栈是否已满。

堆栈的应用

· 用于表达式评估(例如:用于解析和评估数学表达式的调车场算法)。

· 用于在递归编程中实现函数调用。

4.队列

队列是一种FIFO(先进先出-首先放置的元素可以首先访问)结构,该结构通常在许多编程语言中都可以找到。该结构被称为"队列",因为它类似于现实世界中的队列-人们在队列中等待。

2c3bb5fea25316c4a5babd3af3b59305.jpeg

Image Source: pixabay

队列操作

下面给出了可以在队列上执行的2个基本操作。请参考图4,以更好地了解堆栈操作。

· 进队:将元素插入队列的末尾。

· 出队:从队列的开头删除元素。

ed46e99565eeab9a1fc64da59cb59f83.jpeg

Fig 4. Visualization of Basic Operations of Queues

队列的应用

· 用于管理多线程中的线程。

· 用于实施排队系统(例如:优先级队列)。

5.哈希表

哈希表是一种数据结构,用于存储具有与每个键相关联的键的值。此外,如果我们知道与值关联的键,则它有效地支持查找。因此,无论数据大小如何,插入和搜索都非常有效。

当存储在表中时,直接寻址使用值和键之间的一对一映射。但是,当存在大量键值对时,此方法存在问题。该表将具有很多记录,并且非常庞大,考虑到典型计算机上的可用内存,该表可能不切实际甚至无法存储。为避免此问题,我们使用哈希表。关于哈希表的详细介绍可以在python入门与进阶公众号领取算法电子书

哈希函数

名为哈希函数(h)的特殊函数用于克服直接寻址中的上述问题。

在直接访问中,带有密钥k的值存储在插槽k中。使用哈希函数,我们可以计算出每个值都指向的表(插槽)的索引。使用给定键的哈希函数计算的值称为哈希值,它表示该值映射到的表的索引。

· h:哈希函数

· k:应确定其哈希值的键

· m:哈希表的大小(可用插槽数)。一个不接近2的精确乘方的素数是m的一个不错的选择。

991c666162f6d99f2468bdfcbff1eeb1.jpeg

Fig 5. Representation of a Hash Function

· 1→1→1

· 5→5→5

· 23→23→3

· 63→63→3

从上面给出的最后两个示例中,我们可以看到,当哈希函数为多个键生成相同的索引时,就会发生冲突。我们可以通过选择合适的哈希函数h并使用链接和开放式寻址等技术来解决冲突。

哈希表的应用

· 用于实现数据库索引。

· 用于实现关联数组。

· 用于实现"设置"数据结构。

6.树

树是一种层次结构,其中数据按层次进行组织并链接在一起。此结构与链接列表不同,而在链接列表中,项目以线性顺序链接。

在过去的几十年中,已经开发出各种类型的树木,以适合某些应用并满足某些限制。一些示例是二叉搜索树,B树,红黑树,展开树,AVL树和n元树。

二叉搜索树

顾名思义,二进制搜索树(BST)是一种二进制树,其中数据以分层结构进行组织。此数据结构按排序顺序存储值,我们将在本课程中详细研究这些值。

二叉搜索树中的每个节点都包含以下属性。

· key:存储在节点中的值。

· left:指向左孩子的指针。

· 右:指向正确孩子的指针。

· p:指向父节点的指针。

二叉搜索树具有独特的属性,可将其与其他树区分开。此属性称为binary-search-tree属性。

令x为二叉搜索树中的一个节点。

· 如果y是x左子树中的一个节点,则y.key≤x.key

· 如果y是x的右子树中的节点,则y.key≥x.key

8e02ae7a13028a981b84ea5519e7fc36.jpeg

Fig 6. Visualization of Basic Terminology of Trees.

树的应用

· 二叉树:用于实现表达式解析器和表达式求解器。

· 二进制搜索树:用于许多不断输入和输出数据的搜索应用程序中。

· 堆:由JVM(Java虚拟机)用来存储Java对象。

· Trap:用于无线网络。

7.堆

堆是二叉树的一种特殊情况,其中将父节点与其子节点的值进行比较,并对其进行相应排列。

让我们看看如何表示堆。堆可以使用树和数组表示。图7和8显示了我们如何使用二叉树和数组来表示二叉堆。

5eb15b460b843289460bbd6ce94b230a.jpeg

Fig 7. Binary Tree Representation of a Heap

7320cdf7b5264881ceadcb6783e8f340.jpeg

Fig 8. Array Representation of a Heap

堆可以有2种类型。

· 最小堆-父项的密钥小于或等于子项的密钥。这称为min-heap属性。根将包含堆的最小值。

· 最大堆数-父项的密钥大于或等于子项的密钥。这称为max-heap属性。根将包含堆的最大值。

堆的应用

· 用于实现优先级队列,因为可以根据堆属性对优先级值进行排序。

· 可以在O(log n)时间内使用堆来实现队列功能。

· 用于查找给定数组中k个最小(或最大)的值。

· 用于堆排序算法。

8.图

一个图由一组有限的顶点或节点以及一组连接这些顶点的边组成。

图的顺序是图中的顶点数。图的大小是图中的边数。

如果两个节点通过同一边彼此连接,则称它们为相邻节点。

有向图

如果图形G的所有边缘都具有指示什么是起始顶点和什么是终止顶点的方向,则称该图形为有向图。

我们说(u,v)从顶点u入射或离开顶点u,然后入射到或进入顶点v。

自环:从顶点到自身的边。

无向图

如果图G的所有边缘均无方向,则称其为无向图。它可以在两个顶点之间以两种方式传播。

如果顶点未连接到图中的任何其他节点,则称该顶点为孤立的。

a7fc0087b37497733499caaa29ae5ef6.jpeg

Fig 9. Visualization of Terminology of Graphs

图的应用

· 用于表示社交媒体网络。每个用户都是一个顶点,并且在用户连接时会创建一条边。

· 用于表示搜索引擎的网页和链接。互联网上的网页通过超链接相互链接。每页是一个顶点,两页之间的超链接是一条边。用于Google中的页面排名。

· 用于表示GPS中的位置和路线。位置是顶点,连接位置的路线是边。用于计算两个位置之间的最短路径。

参考文献

[1]算法简介,第三版,作者:托马斯·H·科门(Thomas H. Cormen),查尔斯·E·雷森(Charles E. Leiserson),罗纳德·L·里维斯特(Ronald L. Rivest)和克利福德·斯坦(Clifford Stein)。

[2]来自Wikipedia的数据结构列表

(本文翻译自Vijini Mallawaarachchi的文章《8 Common Data Structures every Programmer must know》,参考:https://towardsdatascience.com/8-common-data-structures-every-programmer-must-know-171acf6a1a42)

 
 

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇

 
 

1da37cf6b2af82e081b9187a2666da3f.jpeg

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
专题九:数据结构知识 数据结构是计算机软件的一门基础课程,计算机科学各个领域及有关的应用软件都要用到各数据结构.语言编译要使用栈、散列表及语法树;操作系统用队列、存储管理表及目录树等;数据库系统运用线性表、多链表及索引树等进行数据管理;而在人工智能领域,依求解问题性质的差异将涉及到各不同的数据结构,如广义表、集合、搜索树及各有向图等等。学习数据结构目的是要熟悉一些最常用的数据结构,明确数据结构内在的逻辑关系,知道它们在计算机的存储表示,并结合各典型应用说明它们在进行各操作时的动态性质及实际的执行算法,进一步提高软件计和编程水平。通过对不同存储结构和相应算法的对比,增强我们根据求解问题的性质选择合理的数据结构,并将问题求解算法的空间、时间及复杂性控制在一定范围的能力。 软件设计师考试大纲对数据结构部分的要求是熟练掌握常用数据结构和常用算法,因此,本专题从数据结构的概述出发,对基本的概念引出常用的数据结构类型的介绍和讲解,同时在讲解各数据结构间采用算法与数据结构相结合的方式,在算法步骤使用数据结构,对数据结构的重点、难点进行了分析,最后讲解了与数据结构紧密相关的排序和查找算法,以及一些以往考试题的分析。 1. 数据结构概述 数据结构研究了计算机需要处理的数据对象和对象之间的关系;刻画了应用涉及到的数据的逻辑组织;也描述了数据在计算机如何存储、传送、转换。 学习数据结构注意的问题:  系统掌握基本数据结构的特点及其不同实现。  了解并掌握各数据结构上主要操作的实现及其性能(时间、空间)的分析。  掌握各数据结构的使用特性,在算法设计能够进行选择。  掌握常用的递归、回溯、迭代、递推等方法的设计  掌握自顶向下、逐步求精的程序设计方法。  掌握自顶向下、逐步求精的程序设计方法。 在学习数据结构的知识之前,我们要了解一下数据结构的基本概念。 数据:对客观事物的符号表示,在计算机就是指所有能输入到计算机并被计算机程序所处理的符号的总称。 数据项: 是数据的不可分割的最小单位; 数据元素:是数据的基本单位,在计算机程序通常作为一个整体进行处理;一个数据元素可由若干个数据项组成。 数据对象:是性质相同的数据元素的集合,是数据的一个子集。 数据结构上的基本操作: ◆插入操作 ◆删除操作 ◆更新操作 ◆查找操作 ◆排序操作 数据结构是指数据对象及相互关系和构造方法,一个数据结构B形式上可以用一个二元组表示为B=(A,R)。其,A是数据结构的数据(称为结点)的非空有限集合,R是定义在A上的关系的非空有限集合。 根据数据元素之间的关系的不同特性,通常有下列4类基本结构。  集合——结构的数据元素除了“同属于一个集合”的关系外,别无其他关系。  线性结构——结构的数据元素之间存在一个对一个的关系。  树形结构——结构的元素之间存在一个对多个的关系。  图状结构或网状结构——结构的元素之间存在多个对多个的关系。 数据结构,结点与结点间的相互关系是数据的逻辑结构。数据结构在计算机的表示(又称为映象)称为数据的物理结构,也称存储结构。 数据元素之间的关系在计算机有两不同的表示方式:顺序映象和非顺序映象,并由此得到两不同的存储结构:顺序存储结构和链式存储结构。 任何一个算法的设计取决于选定的数据(逻辑)结构,而算法的实现依赖于采用的存储结构。 数据的逻辑结构分为两类: 线性结构:线性表、栈、队列和串 非线性结构:树、图 数据的存储方法有四类: 顺序存储方法 链接存储方法 索引存储方法 散列存储方法 2. 常用数据结构 2.1线性表 在数据结构,线性结构常称为线性表,是最简单、最常用的一数据结构,它是由n个相同数据类型的结点组成的有限序列。 其特点是:在数据元素的非空有限集合,  ◆存在唯一的一个被称做“第一个”的数据元素  ◆存在唯一的一个被称做“最后一个”的元素数据元素  ◆除第一个之外,集合的每个数据元素均只有一个前驱  ◆除最后一个之外,集合每个数据元素均只有一个后继 一个由n个结点e0,e1…,en-1组成的线性表记为:(e0,e1…,en-1)。线性表的结点个数称为线性表的长度,长度为0的线性表称为空的线性表,简称空表。对于非空线性表,e0是线性表的第一个结点,en-1是线性表的最后一个结点。线性表的结点构成了一个序列,对序列两个相邻结点ei和ei-1,称前者是后者的前驱结点,后者是前者的后继结点。 线性表最重要的性质是线性表结点和相对位置是确定的。 线性表的结点也称为表元,或称为记录,要求线性表的结点一定是同一类型的数据。线性表的结点可由若干个成分组成,其唯一标识表元的成分成为关键字,简称键。 线性表是一个相当灵活的数据结构,它的长度可以根据需要增长或缩短。对线性表的基本运算如下:  INITIATE(L)初始化操作  LENGTH(L) 求长度函数  GET(L,i) 取元素函数  PRIOR(L,elm)求前驱函数  NEXT(L,elm) 求后继函数  LOCATE(L,x) 定位函数  INSERT(L,i,b)插入操作  DELETE(L,i) 删除操作 有多存储方式能将线性表存储在计算机内,其最常用的是顺序存储和链接存储。根据存储方式的不同,其上述的运算实现也不一样。 ◆ 顺序存储:是最简单的存储方式,其特点是逻辑关系上相邻的两个元素在物理位置上也相邻。通常使用一个足够大的数组,从数组的第一个元素开始,将线性表的结点依次存储在数组。 顺序存储方式优点:能直接访问线性表的任意结点。 线性表的第i个元素a[i]的存储位置可以使用以下公式求得: LOC(ai)=LOC(a1)+(i-1)*l 式LOC(a1)是线性表的第一个数据元素a1的存储位置,通常称做线性表的起始位置或基地址。 顺序存储的缺点: 1) 线性表的大小固定,浪费大量的存储空间,不利于节点的增加和减少; 执行线性表的插入和删除操作要移动其他元素,不够方便; ◆链式存储 线性表链接存储是用链表来存储线性表。 单链表(线性链表): 从链表的第一个表元开始,将线性表的结点依次存储在链表的各表元。链表的每个表元除要存储线性表结点的信息以外,还要有一个成分来存储其后继结点的指针。 线性链表的特点是:每个链表都有一个头指针,整个链表的存取必须从头指针开始,头指针指向第一个数据元素的位置,最后的节点指针为空。当链表为空时,头指针为空值;链表非空时,头指针指向第一个节点。 链式存储的缺点: 1) 由于要存储地址指针,所以浪费空间; 直接访问节点不方便; 循环链表: 循环链表是另一形式的链式存储结构,是单链表的变形。它的特点就是表最后一个结点的指针域指向头结点,整个链表形成一个环。因此,从表任意一个结点出发都可以找到表的其他结点。 循环链表和单向链表基本一致,差别仅在于算法循环的条件不是结点的指针是否为空,而是他们的指针是否等于头指针, 循环链表最后一个结点的 link 指针不为 0 (NULL),而是指向了表的前端。 为简化操作,在循环链表往往加入表头结点。 循环链表的特点是:只要知道某一结点的地址,就可搜寻到所有其他结点的地址。 循环链表的示例: 带表头结点的循环链表 : 双向链表: 双向链表是另一形式的链式结构,双向链表的结点有两个指针域,其一指向直接后继,另一指向直接前趋。双向链表克服了单链表的单向性的缺点。 前驱方向 后继方向 双向链表也可以有循环表,链表存在两个环。一个结点的前趋的后继和该结点的后继的前趋都是指向该结点的。 p == p→lLink→rLink == p→rLink→lLink 2.2 栈 栈(Stack)是限定仅在表尾进行插入或删除操作的线性表。表尾端称栈顶(top),表头端称栈底(bottom)。 若有栈 S=(s0,s1,…,sn-1)则s0为栈底结点,sn-1为栈顶结点。通常称栈的结点插入为进栈,栈的结点删除为出栈。因为最后进栈的结点必定最先出栈,所以栈具有后进先出的特点。可以用一下一个图形来形象的表示: 栈有两存储结构:顺序栈和链栈 顺序栈即栈的顺序存储结构是,利用一组地址连续的存储单元依次存放自栈底到栈顶的数据元素,同时设指针top指示栈顶元素的当前位置。 栈也可以用链表实现,链式存储结构的栈简称链栈。若同时需两个以上的栈,则最好采用这结构。对于栈上的操作,总结如下,大家可以仔细看一下这些程序,一个大的程序都是由一些对数据结构的小的操作组成的。 顺序存储的栈的基本操作如下: 判断栈满: int stackfull(seqstack *s) { return (s->top= =stacksize-1); } 进栈: void push(seqstack *s,datatype x) { if (stackfull(s)) error(“stack verflow”); s->data[++s->top]=x; } 判断栈空: int stackempty(seqstack *s) { return (s->top= = -1) } 出栈: datatype pop(seqstack *s) { if (stackempty(s)) error(“stack underflow”); x=s->data[top]; s->top--; return (x); }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值