数据结构面试Q&A

小竹子长大啦

于 2023-03-13 10:53:11 发布

阅读量109

点赞数

文章标签：数据结构面试算法 Powered by 金山文档

本文链接：https://blog.csdn.net/weixin_45703015/article/details/129487911

版权

Q:试举一个数据结构的例子，叙述其逻辑结构和存储结构两方面的含义和相互关系。

A：例如有一张学生基本信息表，主要包括学生的学号、姓名、性别、籍贯、专业等。每个学生基本信息记录对应一个数据元素，学生记录按顺序号排列，形成了学生基本信息记录的线性序列，对学生记录之间的这种关系就确定了学生表的逻辑结构，即线性结构。

这些学生记录在计算机中的存储表示就是存储结构。如果用连续的存储单元(如用数组表示)来存放这些记录，则称为顺序存储结构；如果存储单元不连续，而是随机存放各个记录，然后用指针进行链接，则称为链式存储结构。即相同的逻辑结构，可以对应不同的存储结构。

Q：数据结构三要素

A：逻辑结构、物理结构、数据运算

逻辑结构：线性逻辑结构，集合，树（1对多），图（多对多）

物理结构：顺序存储，链式存储，索引存储（索引表）和散列存储（hash函数，一一对应）

数据运算：运算的定义：运算功能的描述，是基于逻辑的，抽象的；运算的实现：完成运算的算法，是现实的基于存储的。

运算定义—>逻辑结构->存储结构->运算实现

Q：谈谈对于贪心算法的理解

A：寻找最优解的常用办法，把一般求解过程分为若个部分，每步都按照贪心原则，选取当下最好的情况。缺点：但往往得不到最优解

例子：找零钱问题，背包问题（value，weight，value/weight三种贪心策略）

Q：谈谈对动态规划的理解

A：动态规划其实就是，给定一个问题，我们把它拆成一个个子问题，直到子问题可以直接解决。然后呢，把子问题答案保存起来，以减少重复计算。再根据子问题答案反推，得出原问题解的一种方法。

关键在于，拆分子问题，记住过往，减少重复计算。

动态规划有几个典型特征，最优子结构、状态转移方程、边界、重叠子问题。例子：青蛙跳台阶问题（自底向上）

Q：谈谈对共享栈和两个栈组成的队列的理解

A：利用栈底位置相对不变的特性，可让两个顺序栈共享一个一维数组空间，将两个栈的栈底分别设置在共享空间的两端，两个栈顶向共享空间的中间延伸，两个栈顶指针相邻的时候，判断栈满。

两个栈组成的队列，主要是设置一个栈s1为队尾负责入队，一个栈s2为对头，负责出栈。入队时若s1未满则直接入队，若已满但s2为空，则将s1全部移入s2，再入栈。出队时若s2有元素则直接出栈，若没有但s1有则将s1全部移入s2，然后再s2出栈。（移栈时一次全部移完）

Q：谈谈对搜索与回溯算法的理解

A：为了求得问题的解，先选择某一种可能的情况向前探索，在探索过程中，一旦发现原来的选择是错误的，就退回一步重新选择，继续向前探索，如此反复进行，直至得到解或证明无解。

Q：KMP算法

A：KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。

Q：最小生成树算法

A：Prim算法kruskal算法。Prim算法其实就是说在当前顶点集所可以辐射到的边中选择最小的一条边（需要判断该边是否已经在最小生成树中），其实就是一个排序问题，然后贪心选取最小值，O（N^2）。Kruskal算法则是另外一种思维，从边开始，把所有的边按照权值先从小到大排列，接着按照顺序选取每条边（贪心思想），如果这条边的两个端点不属于同一集合，那么就将它们合并，直到所有的点都属于同一个集合为止，其实就是基于并查集的贪心算法O(n*logN)；

Q：最短路径算法

A：Dijkstra，Floyd算法。DJ主要思想为每次在未确定的顶点中选取最短的路径，并把最短路径的顶点设为确定值，然后再由源点经该点出发来松弛其他顶点的路径的值，Floyd主要思想min(Dis(i,j),Dis(i,k)+Dis(k,j))来不断优化带权邻接矩阵

Q：拓扑排序

A：在AOV网中寻找一个没有前驱的顶点并输出，然后删除该顶点和所有以它为起点的有向边，循环直到没有顶点。

Q：谈谈对B树和B+树的理解和应用

A：B树即多路平衡查找树，一颗m阶B树或为空树或为满足如下特性的m叉树。

1. 若根结点不是终端结点，则至少有两颗子树，除根结点外的所有非叶结点至少有m/2（向上取整）颗子树，即至少含有m/2（向上取整）-1个关键字

2．B树的查找效率逼近二分查找

B+树大部分和B树类似主要区别为：

叶节点包含全部关键字，并将关键字按大小进行排序。

所有分支结点中仅包含他的各个子结点中关键字最大的值

应用：B树大量应用在数据库和文件系统当中，将相关数据尽量集中在一起，以便一次读取多个数据，减少硬盘操作次数。mysql使用B+树作为索引。