哈夫曼树(Huffman tree):
又名最优树,指给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。
这里有几个名词我们先来了解一下:
路径和路径长度:
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度,若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1。
结点的权及带权路径长度:
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
树的带权路径长度:
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。WPL=W1* L1+W2* L2+…+Wn* Ln。
哈夫曼树特性
- 权值越大的离根节点越远,权值越小的离根节点越近
- huffmantree的左右子树可以进行交换,不会影响到带权路径长度。
- 带权值的结点都是叶子结点,非叶子结点的权值都是左子树和右子树的权值的总和
- 一颗只有N个叶子结点的huffmantree一共会有2n-1个结点
构建huffmantree
那么如何构建huffmantree呢,我们用1,2,3,4,5构建一棵huffmantree。
如图:
这是我们构建的huffmantree
我们来解释一下构建hufffmantree的过程:
1. 将给定的n个权值看作n个只有根节点的二叉树,那么每棵树的权值就是该结点的权值
2. 从集合中选出两颗权值最小的二叉树,组成一颗新的二叉树,其根节点的权值就是这两颗二叉树的和
3. 将步骤二中选出的两个二叉树从集合中删除,新组成的二叉树根节点的权值看做一个无左右子树的根节点,从里面选出两个最小的
4. 重复步骤2,3.
代码实现:
堆的代码:
#pragma once
#include<iostream>
#include<assert.h>
#include<vector>
using namespace std;
template<