假设共有n个节点需要编码,即huffman tree中有n个叶子节点。
那么会生成n-1个新的中间节点。
(因为只需记录爸爸,因此用数组比较方便)
思路:
①构建大小为2*n-1的数组,用来存储node.
②每次从集合中选取两个weight最小,并且没有爸爸的节点,将他俩构成一颗新的子树,再把新构成的子树加入到数组中。
③直到数组被填满,那么最后一个既是根节点。
前提需要:
struct huffman {
int parent;
int weight;
huffman(int w):parent(-1),weight(w){};
};
int n;//叶子节点的数量
unordered_map<char, int>mp;//初始化时用来存储字母相对应的位置。之后再Define为深度(即编码的长度)vector<huffman*>code(2 * n - 1, nullptr);//用来存储node
找到权重最小的两个无爸爸节点:
void findmin(vector<huffman*>& code,int n, int& min1, int& min2) {
for (int i = 0; i < n; ++i) {
if (code[i]->parent == -1) {
min1 = i;
break;
}
}
for (int i = 0; i < n; ++i) {
if (code[i]->parent == -1 && code[i]->weight < code[min1]->weight)
min1 = i;
}
for (int i = 0; i < n; ++i) {
if (code[i]->parent == -1 && i != min1) {
min2 = i;
break;
}
}
for (int i = 0; i < n; ++i) {
if (code[i]->parent == -1 && code[i]->weight < code[min2]->weight && i!=min1)
min2 = i;
}
}
构造huffman tree:
void hufftree(vector<huffman*>& code, int n) {
int min1, min2;
for (int i = 0; i < n - 1; ++i) {
findmin(code, n+i, min1, min2);
code[n + i] = new huffman(code[min1]->weight + code[min2]->weight);
code[min1]->parent = n + i;
code[min2]->parent = n + i;
}
}
找到每个字母对应的编码长度:
int findlevel(vector<huffman*>& code, int pos) {
int ans = 0;
while (code[pos]->parent != -1) {
pos = code[pos]->parent;
ans++;
}
return ans;
}
void defines(unordered_map<char, int>& mp, vector<huffman*>& code) {
for (auto x : mp) {
int pos = x.second;
mp[x.first] = findlevel(code, pos);
}
}