【习题·数据结构】[NOI2015]荷马史诗(多叉哈夫曼树)

Problem

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 nn 种不同的单词,从 11 到 nn 进行编号。其中第 ii 种单词出现的总次数为 wiwi。Allison 想要用 kk 进制串 sisi 来替换第 ii 种单词,使得其满足如下要求:

对于任意的 1≤i,j≤n1≤i,j≤n,i≠ji≠j,都有:sisi 不是 sjsj 的前缀。

现在 Allison 想要知道,如何选择 sisi,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 sisi 的最短长度是多少?

一个字符串被称为 kk 进制字符串,当且仅当它的每个字符是 00 到 k−1k−1 之间(包括 00 和 k−1k−1)的整数。

字符串 Str1Str1 被称为字符串 Str2Str2 的前缀,当且仅当:存在 1≤t≤m1≤t≤m,使得 Str1=Str2[1…t]Str1=Str2[1…t]。其中,mm 是字符串 Str2Str2 的长度,Str2[1…t]Str2[1…t] 表示 Str2Str2 的前 tt 个字符组成的字符串。

Solution

这道题的编码方式是一个Huffman编码的构造方式,而其对应的结构就是Huffman数。

我们先从trie树的角度去理解这一个问题。

在这里插入图片描述

如图所示,这就是一颗 t r i e trie trie树,按照 k k k叉的方式进行编码正好吻合了 k k k进制的要求;为了保证某个串不是另一个串的前缀,我们只需要保证某一个串的结尾是这一个树的叶节点即可。

然后就是计算答案的问题,我们发现长度 * 出现次数=到根节点的距离 * 这一个点的点权,这正好对应了一个 H u f f m a n Huffman Huffman问题,我们只要保证这一个乘积之和最小即可。然后我们再考虑如何用 H a f f m a n Haffman Haffman树来搞。

对于 k k k

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值