问题:霍夫曼编码是如何利用贪心算法来实现对数据压缩编码,有效节省数据存储空间的。
1. 如何理解“贪心算法”?
例子:容纳100kg物品的背包,如何装价值最大的豆子。自然的想法:依次装单价从高到低的豆子。
贪心问题解决思路:
- 针对一组数据,定义限制值和期望值,希望从中选出几个数据,在满足限制值的情况下,期望值最大。
- 每次选择当前情况下,在对限制值同等贡献量的情况下,对期望值贡献最大的数据。类比到刚刚的例子,每次都从剩下的豆子里面,选择单价最高的,也就是重量相同的情况下,对价值贡献最大的豆子。
- 举几个例子看下贪心算法产生的结果是否是最优的。
局部最优,不代表全局最优。
2. 贪心算法实战分析
- 分糖果
- 找零
- 区间覆盖
3.解答开篇
例子:1000个字符,每个8bits,就要8000bits。如果字符只有6中不同字符,分别是a、b、c、d、e、f,可以用3个bits存储,只要3000bits存储空间。
是否有更有效的存储方式:霍夫曼编码,一般压缩率20%~90%。
贪心是一种思想,主要是需要更多的练习。