哈夫曼算法-lua版实现

哈夫曼算法-lua版实现

简单介绍

哈夫曼编码通过利用字符出现频率,将较常见的字符用较短的编码表示,从而实现数据的压缩和解压缩。

哈夫曼编码(Huffman Coding)是一种基于字符频率进行数据压缩的算法,由David A. Huffman于1952年提出。该算法利用字符出现的频率信息,将出现频率较高的字符用较短的编码表示,而出现频率较低的字符用较长的编码表示,从而有效地减小了数据的存储或传输大小。

哈夫曼编码的基本思想如下:

统计字符频率:遍历待压缩的数据,统计每个字符的出现频率。

构建哈夫曼树:根据字符频率,构建一个哈夫曼树。哈夫曼树是一种特殊的二叉树,其中频率较高的字符位于树的较低层,频率较低的字符位于树的较高层。

分配编码:从根节点开始,给哈夫曼树的左子树分配编码值"0",给右子树分配编码值"1"。通过遍历哈夫曼树的路径,可以得到每个字符的哈夫曼编码。

生成压缩数据:用字符的哈夫曼编码替换原始数据中的字符,从而生成压缩后的数据。

哈夫曼编码的特点是唯一可译性,即任何编码都不会是其他编码的前缀,保证了解码的准确性。

在解压缩时,使用相同的哈夫曼树,通过从根节点开始,根据编码值逐步遍历哈夫曼树,即可将压缩后的编码逐一映射为原始字符,从而还原原始数据。

代码示例

function huffmanEncode(text)
  -- 统计字符频率
  local frequency = {}
  for i = 1, #text do
    local char = text:sub(i, i)
    frequency[char] = (frequency[char] or 0) + 1
  end
  
  -- 构建字符节点列表
  local nodes = {}
  for char, freq in pairs(frequency) do
    table.insert(nodes, {char = char, freq = freq})
  end
  
  -- 构建哈夫曼树
  while #nodes > 1 do
    table.sort(nodes, function(a, b) return a.freq < b.freq end)
    local left = table.remove(nodes, 1)
    local right = table.remove(nodes, 1)
    local parent = {left = left, right = right, freq = left.freq + right.freq}
    table.insert(nodes, parent)
  end
  
  local root = nodes[1] -- 哈夫曼树的根节点
  
  -- 构建编码表
  local codeTable = {}
  
  local function buildCode(node, code)
    code = code or "" -- 初始化编码
    if node.char then -- 叶子节点,记录编码
      codeTable[node.char] = code
    else -- 非叶子节点,递归构建编码
      buildCode(node.left, code .. "0")
      buildCode(node.right, code .. "1")
    end
  end
  
  buildCode(root)
  
  -- 编码文本
  local encodedText = ""
  for i = 1, #text do
    local char = text:sub(i, i)
    encodedText = encodedText .. codeTable[char]
  end
  
  return encodedText, codeTable
end

function huffmanDecode(encodedText, codeTable)
  -- 构建解码表
  local decodeTable = {}
  for char, code in pairs(codeTable) do
    decodeTable[code] = char
  end
  
  -- 解码文本
  local decodedText = ""
  local code = ""
  
  for i = 1, #encodedText do
    code = code .. encodedText:sub(i, i)
    local char = decodeTable[code]
    if char then
      decodedText = decodedText .. char
      code = ""
    end
  end
  
  return decodedText
end

-- 示例使用
local originalText = "Hello, Huffman Encoding!"
print("原始文本:", originalText)

local encodedText, codeTable = huffmanEncode(originalText)
print("编码后:", encodedText)

local decodedText = huffmanDecode(encodedText, codeTable)
print("解码后:", decodedText)

示例中,首先统计文本中字符的频率,然后构建哈夫曼树,编码表和解码表。之后,用编码表来编码文本,或者用解码表来解码编码后的文本

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
你好!以下是无损压缩哈夫曼算法的Python代码实现: ```python from heapq import heappush, heappop, heapify from collections import defaultdict # 计算文件中字符的频率 def frequency(text): frequency = defaultdict(int) for character in text: frequency[character] += 1 return frequency # 构建哈夫曼树 def huffman_tree(frequency): heap = [[weight, [symbol, ""]] for symbol, weight in frequency.items()] heapify(heap) while len(heap) > 1: low_weight = heappop(heap) high_weight = heappop(heap) for pair in low_weight[1:]: pair[1] = "0" + pair[1] for pair in high_weight[1:]: pair[1] = "1" + pair[1] heappush(heap, [low_weight[0] + high_weight[0]] + low_weight[1:] + high_weight[1:]) return sorted(heappop(heap)[1:], key=lambda p: (len(p[-1]), p)) # 压缩文本 def compress(text, frequency): compressed = "" for character in text: compressed += frequency[character] return compressed # 解压缩文本 def decompress(compressed, tree): decompressed = "" sub_tree = tree for bit in compressed: if bit == "0": sub_tree = sub_tree[0] else: sub_tree = sub_tree[1] if type(sub_tree[0]) is str: decompressed += sub_tree[0] sub_tree = tree return decompressed # 示例 text = "hello, world!" frequency = frequency(text) tree = huffman_tree(frequency) compressed = compress(text, dict(tree)) decompressed = decompress(compressed, tree) print("原始文本:", text) print("哈夫曼树:", tree) print("压缩文本:", compressed) print("解压缩文本:", decompressed) ``` 当然,如果你对哈夫曼编码的实现原理还不太了解的话,建议先去学习一下哈夫曼编码相关的知识。感谢你的提问!接下来,笑话时间到了:有两个人在荒岛上打牌,其中一个人突然问:“你能不能想一下,如果世界上所有的人都消失了,那么这座岛还能不能叫荒岛?”另一个人摇了摇头说:“这个问题太深奥了,我们还是继续打牌吧。”

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值