数据结构简述

简单说,数据结构就是一个容器,以某种特定的布局存储数据。这个“布局”使得数据结构在某些操作上非常高效,在另一些操作上则不那么高效。你的目标就是理解数据结构,这样就能为手头的问题选择最优的数据结构。

常用的数据结构

  • 数组
    数组是一种最简单和最广泛使用的数据结构,其它数据结构比如堆栈和队列都源自数组。
    基本操作
    Insert——在给定索引位置插入一个元素
    Get——返回给定索引位置的元素
    Delete——删除给定索引位置的元素
    Size——获取数组内所有元素的总数
 常问的数组问题:
    找到数组中第二小的元素
    找到数组中第一个没有重复的整数
    合并两个分类数组
    重新排列数组中的正值和负值
  • 堆栈
    可以把堆栈看作一堆垂直排列的书籍。为了获得位于中间位置的书,你需要拿掉放在它上面的所有书籍。这就是 LIFO(后进先出)方法的工作原理。
    堆栈的基本操作:
    Push——在顶部插入元素
    Pop—— 从堆栈中删除后返回顶部元素
    isEmpty——如果堆栈为空,则返回 true
    Top ——返回顶部元素,但不从堆栈中删除
常见的堆栈面试问题:
    使用堆栈计算后缀表达式
    对堆栈中的值进行排序
    检查表达式中的括号是否平衡
  • 队列
    队列是另一种线性数据结构,以顺序方式存储元素。堆栈和队列之间唯一的显着区别是,队列不是使用 LIFO 方法,而是应用 FIFO 方法。
    队列的基本操作:
    Enqueue() —— 向队列末尾插入元素
    Dequeue() —— 从队列头部移除元素
    isEmpty() —— 如果队列为空,则返回 true
    Top() —— 返回队列的第一个元素

    常问的队列问题:
    使用队列来实现堆栈(可参考:[https://blog.csdn.net/upupday19/article/details/79250085])
    颠倒队列中前 k 个元素的顺序
    使用队列生成从 1 到 n 的二进制数

  • 链表
    链表就像一个节点链,其中每个节点包含数据和指向链中后续节点的指针等信息。有一个头指针,指向链表的第一个元素,如果列表是空的,那么它只指向 null 或不指向任何内容。链表用于实现文件系统,哈希表和邻接表。

链表的类型:单链表(单向),双链表(双向)
链表的基本操作:
InsertAtEnd —— 在链表末尾插入指定元素
InsertAtHead —— 在链表头部插入指定元素
Delete —— 从链表中删除指定元素
DeleteAtHead —— 删除链表的第一个元素
Search —— 返回链表中的指定元素
isEmpty —— 如果链表为空,返回 true

 常问的链表问题:
    翻转列表
    检测链表中的循环
    返回链表中倒数第 n 个节点
    移除链表中的重复值

  • 图就是一组节点,以网络的形式互相连接。节点也被称为顶点(vertices)。一对(x,y)就叫做一个边,表示顶点 x 和顶点 y 相连。一个边可能包含权重/成本,显示从顶点 x 到 y 所需的成本。
    图的类型:无向图,有向图
    在编程语言中,图可以表示为两种形式:邻接矩阵,邻接列表
    常见的图遍历算法:广度优先搜索,深度优先搜索,

    常问的图问题
    实现广度优先搜索和深度优先搜索
    检查一个图是否为树
    计算一张图中的边的数量
    找到两个顶点之间的最短路径


  • 树是一种层级数据结构,包含了连接它们的顶点(节点)和边。树和图很相似,但二者有个很大的不同点,即树中没有循环。树广泛应用在人工智能和复杂的算法中,为解决各种问题提供高效的存储机制。
    下面是几种类型的树:
    N 叉树
    平衡树
    二叉树
    二叉搜索树
    平衡二叉树
    红黑树
    2-3 树
    其中,二叉树和二叉搜索树是最常用的树。

    常问的树问题:
    找到一个二叉树的高度
    找到一个二叉搜索树中第 k 个最大值
    找到距离根部“k”个距离的节点
    找到一个二叉树中给定节点的祖先(ancestors)

  • 字典树
    也叫“前缀树”,是一种树形结构,在解决字符串相关问题中非常高效。其提供非常快速的检索功能,常用于搜索字典中的单词,为搜索引擎提供自动搜索建议,甚至能用于IP路由选择。
    下面展示了 “top” “thus” 和 “their” 这三个词是如何存储在字典树中的:
    在这里插入图片描述
    常见的字典树问题:
    计算字典树中的总字数
    打印存储在字典树中的所有单词
    使用字典树对数组的元素进行排序
    使用字典树从字典中形成单词
    构建一个T9字典

  • 哈希表
    散列是一个用于唯一标识对象并在一些预先计算的唯一索引(称为“密钥”)存储每个对象的过程。因此,对象以“键值”对的形式存储,这些项的集合被称为“字典”。可以使用该键值搜索每个对象。有多种不同的基于哈希的数据结构,但最常用的数据结构是哈希表。
    哈希表通常使用数组实现。
    哈希数据结构的性能取决于以下三个因素:哈希函数,哈希表的大小,碰撞处理方法

    常问的哈希问题:
    找到数组中的对称对
    追踪遍历的完整路径
    查看一个数组是否为另一个数组的子集
    检查给定数组是否不相交

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
KMP算法是一种字符串匹配算法,用于在一个较长的字符串查找一个较短的模式串。它通过构建next数组来实现快速匹配。 KMP算法的核心思想是在每次失配时,不是将模式串向后移动一位,而是将模式串向后移动至下一次可以和前面部分匹配的位置,从而跳过大部分的失配步骤。这样可以大大提高匹配效率。 next数组是部分匹配值表,它存放的是每一个下标对应的部分匹配值。部分匹配值是指前缀和后缀的最长共有元素的长度。通过构建next数组,可以在匹配过程根据当前失配的位置快速确定模式串的移动步数。 下面是手动模拟KMP算法的过程: 1. 首先,根据模式串构建next数组。假设模式串为p[],长度为m。初始化next数组,next = -1,next = 0。 2. 从第2个位置开始,依次计算next[i]的值。假设已经计算到next[i-1],则比较p[i-1]和p[next[i-1]]的值: - 如果p[i-1]等于p[next[i-1]],则next[i] = next[i-1] + 1; - 如果p[i-1]不等于p[next[i-1]],则将next[i-1]的值赋给j,然后继续比较p[i-1]和p[j]的值,直到找到一个满足p[i-1]等于p[j]的位置或者j等于0为止。此时,next[i] = j。 3. 完成next数组的构建后,开始匹配过程。假设待匹配的字符串为s[],长度为n。初始化i = 0,j = 0。 4. 依次比较s[i]和p[j]的值: - 如果s[i]等于p[j],则i和j分别向后移动一位; - 如果s[i]不等于p[j],则根据next数组确定模式串的移动步数。将j移动到next[j]的位置,即j = next[j]。 5. 重复步骤4,直到匹配成功(j等于模式串的长度m)或者遍历完整个字符串s。 通过上述步骤,可以实现高效的字符串匹配。KMP算法的时间复杂度为O(n+m),其n为字符串s的长度,m为模式串p的长度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值