贪心
鱼塘钓鱼问题
约翰有h(1≤h≤16)个小时的时间,在该地区有n(2≤n≤25)个湖,这些湖刚好分布在一条路线上,该路线是单向的。约翰从湖1出发,他可以在任一个湖结束钓鱼。但他只能从一个湖到达另一个与之相邻的湖,而且不必每个湖都停留。
- 假设湖i(i=1~n—1),以5分钟为单位,从湖i到湖i+1需要的时间用ti(0<ti≤192)表示。例如t3=4,是指从湖3到湖4需要花20分钟时间。
已知在最初5分钟,湖i预计钓到鱼的数量为fi(fi≥0)。以后每隔5分钟,预计钓到鱼的数量将以常数di(di≥0)递减。如果某个时段预计钓到鱼的数量小于或等于di,那么在下一时段将钓不到鱼。为简单起见,假设没有其它的钓鱼者影响约翰的钓鱼数量。
编写程序,帮助约翰制定钓鱼旅行的计划,以便尽可能多的钓到鱼。
- 输入
对每组测试例,第一行是n,接下来一行是h。下面一行是n个整数fi(1≤i≤n),然后是一行n个整数di(1≤i≤n),最后一行是n—1个整数ti(1≤i≤n—1)。
1 | 4 | 4 |
---|---|---|
4 | 4 | |
2 //n | 10 15 20 17 | 10 15 50 30 |
1 //h | 0 3 4 3 | 0 3 4 3 |
10 1 //fi | 1 2 3 | 1 2 3 |
2 5 //di | 0 | |
2 //ti |
- 输出
对每个测试例,输出在每个湖上花费的时间,这是约翰要实现钓到最多的鱼的计划(必须使整个计划在同一行输出)。
接下来一行是钓到的鱼的数量:
如果存在很多方案,尽可能选择在湖1钓鱼所耗费的时间,即使有些时段没有钓到鱼;如果还是无法区分,那就尽可能选择在湖2钓鱼所耗费的时间,以此类推。
输出样例
45, 5
Number of fish expected: 31
240, 0, 0, 0
Number of fish expected: 480
115, 10, 50, 35
Number of fish expected: 724
数据结构
每个湖预计钓到鱼的数量,定义为数组:
#define NUM 30
int f[NUM];
每个湖预计钓到鱼的数量的递减值,定义为数组:
int d[NUM];
相邻湖之间的旅行时间,定义为数组:
int t[NUM];
钓鱼计划,定义为数组:
int plan[NUM];
湖的个数n,用于钓鱼的时间h,尽可能多的钓鱼数量best。
搜索
在任意一个湖结束钓鱼时的最优钓鱼计划
首先把用于钓鱼的时间h,由小时转换为以5分钟为单位的时间:h=h×60/5;
这样把钓5分钟鱼的时间称为钓一次鱼。由于约翰从湖1出发,可以在任一个湖结束钓鱼,要得到最优解,就需要进行搜索。
设花费在路程上的时间为:
int time= 0;
假设约翰在第m个湖结束钓鱼,因为路程是单向的,所以路程上的时间:
于是展开搜索:
for(i=1;i<=n&&h-time;++i){
greedy(i,h-time);
time+=t[i];
}
void greedy(int pos, int time);
约翰在第pos个湖结束钓鱼,用于钓鱼的时间是time(不含路程),即钓鱼time次。
贪心策略
采用贪心策略,每次选择鱼最多的湖钓一次鱼
对于每个湖来说,由于在任何时候鱼的数目只和约翰在该湖里钓鱼的次数有关,和钓鱼的总次数无关,所以这个策略是最优的。一共可以钓鱼time次,每次在n个湖中选择鱼最多的一个湖钓鱼。
采用贪心算法构造约翰的钓鱼计划。
- 可以认为约翰能从一个湖“瞬间转移”到另一个湖,即在任意一个时刻都可以从湖1到湖pos中任选一个钓一次鱼。
//从湖1起到湖pos止,花费时间time(不含路程)的钓鱼计划
void greedy(int pos, int time)
{
if (time <= 0) return; //时间已经用完
int i, j;
int fish[MAXN];
int p[MAXN];
int t = 0;
for (i = 0; i < pos; ++i)
fish[i] = f[i];
memset(p, 0, sizeof(p));
//在时间time内,选择鱼最多的湖钓鱼;如果鱼都没有了,就把时间放在湖1上
for (i = 0; i < time; ++i)
{
int max = 0; //鱼最多的湖中,鱼的数量
int id = -1; //鱼最多的湖的编号
//查找鱼最多的湖中,鱼的数量和湖的编号
for (j = 0; j < pos; ++j)
if (fish[j] > max){
max = fish[j];
id = j;
}
if (id != -1) //找到了,进行钓鱼处理
{
++p[id];
fish[id] -= d[id];
t += max;
}
//没有找到(从湖1起到湖pos全部钓完了),就把时间放在湖1上
else ++p[0];
}
//处理最优方案
if (t > best)
{
best = t; //最优值
memset(plan, 0, sizeof(plan));
for (i = 0; i < pos; ++i) //最优解
plan[i] = p[i];
}
输出钓鱼计划时,再把5乘回去,就变成实际的钓鱼时间(分钟):
for (i=0; i<n-1; ++i)
printf("%d, ", plan[i] * 5);
printf("%d\n", plan[n-1] * 5);
printf("Number of fish expected: %d\n", best);
慕课
最优前缀码及哈夫曼算法
二元前缀码
用0-1字符串作为代码表示字符,要求任何字符的代码都不能作为其它字符代码的前缀
解码的歧义,例如字符串 0100001
解码1: | 01,00,001 | d,b,a |
---|---|---|
解码2: | 010,00,01 | c,b,d |
前缀码的二叉树表示
前缀码:
{00000, 00001, 0001, 001, 01,100,101,11}
构造树:
0 -左子树
1-右子树
码对应一片树叶
最大位数为树深
平均传输位数
B=[(5+5)5+104+(15+10+10)*3+(25+20)*2]/100=2.85
问题:给定字符集C={x1,x2,…,xn}和每个字符的频率f(xi),i=1,2,…,n. 求关于C的一个最优前缀码(平均传输位数最小).
哈夫曼树算法伪码
算法 Huffman(C )
输入:C ={x1, x2,…, xn}, f(xi), i=1,2,…,n.
输出:Q/ /队列
- n <- |C|
- Q <- C //频率递增队列Q
- for i <- 1 to n-1 do
- z <- Allocate-Node() //生成结点z
- z.left <- Q中最小元 //最小作z左儿子
- z.right <- Q中最小元 //最小作z右儿子
- f(z) <- f(x)+f(y)
- Insert(Q,z) //将z插入Q
- return
最优前缀码性质:引理1
引理1: C是字符集,∀c∈C, f©为频率, x,y∈C, f(x), f(y)频率最小, 那么存在最优二元前缀码使得 x, y 码字等长且仅在最后一位不同.
最优前缀码性质:引理2
引理2 设T是二元前缀码的二叉树,∀x, y∈T,x,y是树叶兄弟,z是x,y的父亲,令T’=T-{x,y},且令z的频率:f(z)=f(x)+f(y)。
T’是对应二元前缀码C’=(C-{x,y})∪{z}的二叉树,那么B(T)=B(T’)+f(x)+f (y)。
哈夫曼算法的正确性证明
两个引理
引理1: C是字符集,∀c∈C, f©为频率, x,y∈C, f(x), f(y)频率最小, 那么存在最优二元前缀码使得 x, y 码字等长且仅在最后一位不同.
引理2 设T是二元前缀码的二叉树,∀x, y∈T,x,y是树叶兄弟,z是x,y的父亲,令T’=T-{x,y},且令z的频率:f(z)=f(x)+f(y)。
T’是对应二元前缀码C’=(C-{x,y})∪{z}的二叉树,那么B(T)=B(T’)+f(x)+f (y)。
算法正确性证明思路
- 定理:Huffman 算法对任意规模为n(n>=2)的字符集C都得到关于C的最优前缀码的二叉树.
- 归纳基础:证明:对于n=2的字符集, Huffman算法得到最优前缀码.
- 归纳步骤: 证明:假设Huffman算法对于规模为 k 的字符集都得到最优前缀码,那么对于规模为k+1的字符集也得到最优前缀码.
归纳基础
n=2,字符集,C={x1, x2},对任何代码的字符至少都需要1位二进制数字. Huffman算法得到的代码是 0 和 1,是最优前缀码.
归纳步骤
假设Huffman算法对于规模为 k 的字 符集都得到最优前缀码. 考虑规模为 k+1的字符集C = {x1, x2, …, xk+1},其中 x1, x2∈C是频率最小的两个字符.
根据归纳假设,算法得到一棵关于字符集 C’,频率f(z)和f(xi) (i =3,4, …,k+1) 的最优前缀码的二叉树T’.
把 x1, x2作为 z的儿子附到 T’上,得到树T,那么T是关于C=(C’-{z})∪{x1, x2}的最优前缀码的二叉树.
如若不然, 存在更优树 T*, B(T*)<B(T),且由引理1,其树叶兄弟是 x1和 x2.去掉 T中 x1和 x2,得到T’. 根据引理2:B(T*’)=B(T*)-( f(x1)+f(x2))< B(T)-( f(x1)+f(x2))= B(T’ )与 T’是一棵关于C’的最优前缀码的二叉树矛盾.