基本数据结构
表、栈、队列
表:分为物理连续存储表和逻辑连续存储表。
物理连续存储表:数组
逻辑连续存储表:链表
STL中实现:vector && list
栈:后进先出,带有限制的表
STL中实现:stack
应用:平衡符号,后缀表达式(中缀转后缀,计算后缀)
详解中缀转后缀:
- 读入表达式,若遇到字符则从尾部放入输出。若遇到符号,则看栈顶符号跟当前符号比较,若当前符号优先级更大则放入栈中,否则弹出栈的符号,直至遇见一个优先级比当前小的符号。
- 若遇到左括号,则其有最高优先级,放入栈中。此时不管紧连着左括号的符号优先级如何,直到读到右括号,才将栈中左括号之上的元素均弹出。
- 当字符读完后,则将栈中符号全部弹出。
队列:先入先出的一种表。
STL实现:queue
树
树的一些术语:
- 根节点,树叶节点,兄弟节点,父节点和子节点,祖父和孙子结点。
- 路径,路径的长,深度,祖先,后裔,真祖先,真后裔。
- 树的度(其子结点的个数)
特殊的一些树:
- 二叉树,二叉查找树,二叉平衡树。
- 表达式树
- B树,B+树
- 线索二叉树
树的遍历:前序中序后序层序。
树的性质:n0=n2+1
树的表示方法:
- 父亲儿子表示
- 儿子兄弟表示:左节点存第一个儿子,右节点存其兄弟,将其旋转45度可得到一个二叉树。
树的转换:
- 树转换为二叉树:树中所有相邻兄弟结点连线,对于树中的每一个节点,只保留它与自己第一个孩子结点之间的连线,删去它与其他孩子结点之间的连线。
- 森林转换为二叉树:先将每一颗树转换为二叉树,然后从第二课树开始,依次将当前树的根节点作为上一颗树的右子节点。
- 二叉树转换为森林:若一个结点是其父亲的右子节点,则将该节点与其祖先连接起来,删除所有节点与其右孩子的连线。
二叉平衡树:
- 性质:高度为h的平衡二叉树最小结点数:N(h)=N(h-1)+N(h-2)+1。N(0)=1,N(1)=2。
- 二叉树的插入:要检验平衡因子,可能会进行左旋右旋,左右旋,右左旋四种旋转。
散列
散列表:将value值根据一定关系,映射到key中,如:H[key]=value,H[1]=100.
散列函数:f:A->B。用于进行映射的函数,常用:直接定址,除留余数,数字分析,折叠法,平方取中。
冲突处理:
- 分离链接法:将冲突元素保留到链表当中。
- 线性探测法:若遇到冲突,则往后找空的位置
- 平方探测法
- 双散列:遇到冲突再散列一次
- 再散列:若列表填的太满。则建立一个大约两倍的表
简单计算:
- 装填因子:散列表空间大小m,填入表中元素个数n,a=n/m。
- ASLs、ASLu:
STL实现树和散列表:
set、unordered_set、multiset
map、unordered_map
堆
堆是一种完全二叉树,且具有某些特殊性质,如大根小跟等。
应用:优先队列,堆排序,哈弗曼编码。
哈夫曼树:
- WPL最小的二叉树
- 构造:每次取权值最小的两个节点连接,再将其放回列表中。
- 特点:没有度为1的结点,n个叶子结点的哈夫曼树有2n-1个结点,对一组权值存在不同构(即通过翻转左右子节点可以得到)的二叉树。
哈夫曼编码:对字符串进行编码,使其存储空间最少,为避免二义性,会用前缀码,即任何字符的编码不是另一字符的前缀,本质上是将字符存在树的叶子结点上。
并查集:略
STL实现优先队列:priority_queue