编程,一扯到算法的问题,就容易混乱,毕竟人的思维和计算机的思维,有时候转换起来总会觉得什么地方不对劲。huffman算法写过很多次了,但有时候自己也总是会被搞混了,最近学了个新语言--python,所以自己也稍微尝试了一下。
class HuffmanItem:
item = ""
value = 0
marked = False
code = ""
left = -1
right = -1
def __init__(self,item="",value=0):
self.item = item
self.value = value
class Huffman:
arr = []
result = []
def __init__(self):
self.initArr()
def initArr(self):
self.addItem("a",15)
self.addItem("b",7)
self.addItem("c",6)
self.addItem("d",6)
self.addItem("e",5)
def addItem(self,item,value):
if item and value > 0:
self.arr.append(HuffmanItem(item,value))
def initResult(self):
for i in self.arr:
self.result.append(i)
for i in range(len(self.arr),2*len(self.arr)-1):
self.result.append(HuffmanItem())
def clearItem(self):
self.arr = []
self.result = []
def getMinItem(self):
index = 0
value = 0
item = ""
for i in range(len(self.result)):
if not self.result[i].marked and self.result[i].value > 0:
if value == 0 or self.result[i].value < value:
index = i
value = self.result[i].value
item = self.result[i].item
self.result[index].marked = True
#print [index,value,item]
return [index,value,item]
def calcHuffman(self):
index = len(self.arr)
self.initResult()
while index < len(self.result):
ret1 = self.getMinItem()
left = ret1[0]
value1 = ret1[1]
item1 = ret1[2]
ret2 = self.getMinItem()
right = ret2[0]
value2 = ret2[1]
item2 = ret2[2]
self.result[index].item = item1+item2
self.result[index].value = value1+value2
self.result[index].left = left
self.result[index].right = right
index += 1
def huffmanCoding(self,index,code):
self.result[index].code += code
left = self.result[index].left
right = self.result[index].right
if left >= 0:
self.huffmanCoding(left,self.result[index].code+"0")
if right >= 0:
self.huffmanCoding(right,self.result[index].code+"1")
def printResult(self):
self.calcHuffman()
index = len(self.result)
self.huffmanCoding(index-1,"")
info = ""
count = 0
for i in range(len(self.arr)):
item =self.result[i]
info += "{%s,%d,huffmanCode:%s} " \
%(item.item,item.value,item.code)+"\r\n"
count += 1
print info
self.clearItem()
Huffman().printResult()
代码粘贴完了,说说自己的对这个算法的感悟吧,首先是在原有数组(长度为n)的基础上构造一个新数组(长度为2n-1)。这个新数组的前n个元素和原有数组完全一致,后面的n-1个元素初始化为空。然后还需要有一个从新数组中还没被标记的元素中筛选出最小元素的方法,调用该方法两次,选择出两个所谓的最小值元素,用这两个元素构造出一个新元素,把新元素填充到新数组的最后面,同时该新元素也成为了一个可以被筛选的对象,那两个最小值元素也成为了该新元素的左右孩子。依次循环到不能再进行选择了,新数组也就构造完成了。之后就可以从最后一个元素开始,对所有的元素进行huffman编码了,这里就是一个递归的操作,可以看代码理解,说起来会比较啰嗦。
总结:本不太习惯在网上写博客,印象中好像这应该是第一篇博文,而且还是用比较繁琐的语言在说这历史悠久的huffman编码,其中主要也是由于自己不喜欢用伪代码的方式描述,而且自己的所感所悟,也更倾向于用文字去阐述,哪怕是讲算法,哪怕是文字显得很乏味。