树
定义
树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。
在任意一颗非空树中:
1)有且仅有一个特定的称为根(Root)的结点;2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、…、Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
此外,树的定义还需要强调以下两点:
1)n>0时根结点是唯一的,不可能存在多个根结点,数据结构中的树只能有一个根结点。
2)m>0时,子树的个数没有限制,但它们一定是互不相交的。
这是一棵普通的树。
由树的定义可以看出,树的定义使用了递归的方式。
度
结点拥有的子树数目称为结点的度。
结点的关系
结点子树的根结点为该结点的孩子结点。相应该结点称为孩子结点的双亲结点。
同一个双亲结点的孩子结点之间互称兄弟结点。
层次
从根开始定义起,根为第一层,根的孩子为第二层,以此类推。
深度
树中结点的最大层次数称为树的深度或高度。
二叉树
定义
二叉树是n(n>=0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树组成。
特点
1)每个结点最多有两颗子树,所以二叉树中不存在度大于2的结点。
2)左子树和右子树是有顺序的,次序不能任意颠倒。
3)即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
性质
1)在二叉树的第i层上最多有2i-1 个节点。(i>=1)
2)二叉树中如果深度为k,那么每层最多有 2^(k-1) 个节点;一共最多有 2^(k)-1 个节点。(k>=1)
3)n0=n2+1;n0表示度数为0的节点数,n2表示度数为2的节点数。
4)在完全二叉树中,具有n个节点的完全二叉树的深度为[log2n]+1,其中[log2n]是向下取整。
斜树
斜树:所有的结点都只有左子树的二叉树叫左斜树。这两者统称为斜树。
就是只有一条。
满二叉树
在一棵二叉树中。如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
满二叉树的特点有:
1)叶子只能出现在最下一层。出现在其它层就不可能达成平衡。
2)非叶子结点的度一定是2。
3)在同样深度的二叉树中,满二叉树的结点个数最多,叶子数最多。
完全二叉树
对一颗具有n个结点的二叉树按层编号,如果编号为i(1<=i<=n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。
最后一层有几个无所谓,但是中间不能是空的。
特点:
1)叶子结点只能出现在最下层和次下层。
2)最下层的叶子结点集中在树的左部。
3)倒数第二层若存在叶子结点,一定在右部连续位置。
4)如果结点度为1,则该结点只有左孩子,即没有右子树。
5)同样结点数目的二叉树,完全二叉树深度最小。
满二叉树一定是完全二叉树,但完全二叉树不一定是满二叉树。
二叉树的存储结构
顺序结构
二叉树的顺序存储结构就是使用一维数组存储二叉树中的结点,并且结点的存储位置,就是数组的下标索引。
但是顺序存储结构除了二叉树是完全或者满时利用率不高,是斜树的时候最浪费空间。
所以一般使用二叉链表(链式结构)。
二叉链表
结点数据结构定义为一个数据和两个指针域。
遍历
每个结点被访问一次,且仅被访问一次。
二叉树的访问次序可以分为四种:
前序遍历:根-左-右(对于所有的树都是)ABDHIEJCFG
中序遍历:左-根-右 HDIBJEAFCG
后序遍历:左-右-根 HIDJEBFGCA
层序遍历:一层一层的 ABCDEFGHIJ
已知前序遍历序列和后序遍历序列,不可以唯一确定一棵二叉树。
虽然二叉树的遍历过程看似繁琐,但是由于二叉树是一种递归定义的结构,故采用递归方式遍历二叉树的代码十分简单。
递归实现代码如下:
/*二叉树的前序遍历递归算法*/
void PreOrderTraverse(BiTree T) {
if(T==NULL) {
return;
}
printf("%c", T->data); /*显示结点数据,可以更改为其他对结点操作*/
PreOrderTraverse(T->lchild); /*再先序遍历左子树*/
PreOrderTraverse(T->rchild); /*最后先序遍历右子树*/
}
/*二叉树的中序遍历递归算法*/
void InOrderTraverse(BiTree T) {
if(T==NULL) {
return;
}
InOrderTraverse(T->lchild); /*中序遍历左子树*/
printf("%c", T->data); /*显示结点数据,可以更改为其他对结点操作*/
InOrderTraverse(T->rchild); /*最后中序遍历右子树*/
}
/*二叉树的后序遍历递归算法*/
void PostOrderTraverse(BiTree T) {
if(T==NULL){
return;
}
PostOrderTraverse(T->lchild); /*先后序遍历左子树*/
PostOrderTraverse(T->rchild); /*再后续遍历右子树*/
printf("%c", T->data); /*显示结点数据,可以更改为其他对结点操作*/
}
二叉排序树(二叉查找树)
二叉排序树(Binary Sort Tree)或者是一颗空树;或者是具有如下性质的二叉树:
(1) 若它的左子树不空,则左子树上所有结点的值均小于 它的根结点的值;
(2) 若它的右子树不空,则右子树上所有结点的值均大于 它的根结点的值;
(3) 它的左、右子树又分别为二叉排序树 。
这种方式正是二分查找的思想,查找所需的最大次数等同于二叉排序树的高度。之后所有的优化都是为了降低树的高度。
二叉查找树效率比较高,但是当树为斜树的时候效率很低。
平衡二叉树(AVL树)
这种左右子树的高度相差不超过 1 的树为平衡二叉树。
因为当节点数目一定,保持树的左右两端保持平衡,树的查找效率最高。要矮胖(平衡)不要瘦高(斜树)。
红黑树
红黑树(Red Black Tree) 是一种自平衡二叉排序树。自平衡:插入和删除时自动平衡。
红黑树还有以下特点:
- 节点是红色或黑色。
- 根是黑色。
- 所有叶子都是黑色(叶子是NIL节点)。
- 每个红色节点必须有两个黑色的子节点。(从每个叶子到根的所有路径上不能有两个连续的红色节点。)
- 从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点。
正是因为这些规则限制,才保证了红黑树的自平衡。
特点
是一个二叉排序树,趋近于平衡树(但是不能简单说就是平衡二叉树),查询的速度非常的快,查询叶子节点最大次数和最小次数不能超过2倍。
红黑树是一种特化的AVL树(平衡二叉树),都是在进行插入和删除操作时通过特定操作保持二叉查找树的平衡,从而获得较高的查找性能。