紫书例题:Message Decoding(UVa 213)
1.题目:
考虑下面的01串序列:0,00,01,10,000,001,010,011,100,101,110,0000,001,。。。,1101,1110,00000,。。。
首先是长度为1的串,然后是长度为2的串,依次类推。如果看成二进制,相同长度的后一个串等于前一个串加1,注意上述序列中不存在全为1的串。
你的任务是编写一个解码程序。首先输入一个编码头(例如 AB#TANCnrtXc),则上述序列的每一个串依次对应编码头的每一个字符。例如0对应A,00对应B,01对应#,。。。,110对应X,0000对应c。接下来是编码文本(可能有多行组成,你应该把它们拼接成一个长长的01串)。编码有多个小节组成,每个小节的前3个数字代表小节中每个编码的长度(用二进制表示,例如010代表长度为2),然后是各个字符的编码,以全1结束(例如,编码长度为2的小节以11结束)。编码文本以编码长度为000的小节结束。
例如,编码头为$#**\,编码文本为0100000101101100011100101000,应该这样解码:010(编码长度为2)00(#)00(#)10(*)11(小节结束)011(编码长度为3)000(\)111(小节结束)001(编码长度为1)0($)1(小节结束)000(编码结束)
样例输入:
TNM AEIOU
0010101100011
1010001001110110011
11000
$#**\
0100000101101100011100101000
样例输出:
TAN ME
##*\$
2.思路:
这道题怎么看都没有什么难的地方。01字符串对应编码头也不难:
假设编码头存放在了数组s,那么01字符串与数组s下标i的对应关系为 i=(2^字符串长度)-(长度+1)+字符串值
比如字符串0001,i=(2^0001的长度)-(0001的长度+1)+0001字符串值
即 i=(2^4)-(4+1)+1=12,∴0001对应s[12]。
这个问题解决了,什么小节结束啦这些都洒洒水啦
按照以往读取完实例的数据再处理的思路,我先写了字符串处理函数,能将字符串成功解码;
然后再编写一个函数,专门用来接收数据。这样等读取完一个测试实例后,将其解码就行了。
#include<stdio.h>
#include<iostream>
#include<string.h>
using namespace std;
//乘方辅助器
int mypow(int i,int j){
if(j<=0){
return 1;
}
return i<<(j-1);
}
/*字符段解码器
①val>=0,表示该段01字符串对应的字符数组[val]
对应关系式:
(2^字符串长度)-字符串长度-1+字符串数值,比如0001,对应字符数组[2^(0001长度)-0001长度-1+0001字符串值]=字符数组[(2^4)-4-1+1]=字符串[12]
②val=-1,表示小节结束
*/
int decode(char *r,int i,int len,int type){//解码字符串;解码开始位置;解码长度;解码类型(0为编码长度,1为对于编码)
int val=0;
for(int j=i;j<len+i;++j){
val+=mypow(2,len+i-j-1)*(r[j]-48);
}
if(type==0){
return val;
}
if(val==mypow(2,len)-1){
return -1;
}
val+=mypow(2,len)-len-1;
return val;
}
//字符串翻译输出器
void read(char *r,char *codes){
int len=decode(r,0,3,0);//字符串编码长度
int p=3;
while(p<strlen(r)){
int num=decode(r,p,len,1);
if(num>=0){//非小节结束
printf("%c",codes[num]);
p+=len;
}else{//小节结束,求下一解字符串编码长度
p+=len;
len=decode(r,p,3,0);
p+=3;
}
}
}
//中央处理+数据输入
int main(){
char codes[100]="TNM AEIOU";//编码数组
char r[100]="0010101100011101000100111011001111000";//需要解码的字符串
read(r,codes);
printf("\n");
return 0;
}
然后我就被摆了一道
怎么回事?我们来观察一下测试数据:
TNM AEIOU
0010101100011
1010001001110110011
11000
$#**\
0100000101101100011100101000
实例间没有间隔的标记(还好)。更狗的是,01字符串不一次输入完,非要分几行输入。大哥你这不搞事吗?
这就很蛋疼了,因为题目对编码头没限制,那按照题目的尿性,就一定会含有“0”或“1”了。
这样的话连判断每行第1个输入的字符是否为“0”或“1”来判断是否输入完01字符串都不行了,这真是在为难我胖虎啊。
那紫书是怎么做的呢?原来紫书用getchar,边读取边翻译。反正编码长度已经知道了,只要读够相应长度的01串,就把翻译好的字符输出来,不用傻傻地等待后面算是否还有数据。
算是开了眼了,有的题目居然不能完整读完再弄,只能边读边处理!
AC代码(调试了一个晚上,不容易啊)
/**
UVA 213
**/
#include<stdio.h>
#include<string.h>
#include<iostream>
using namespace std;
char code[7*256];
void readcode(){
}
//获取编码头
int inputchar(){
for(int i=0;i<7*256;++i){
code[i]=0;
}
char ch;
int k=0;
while((ch=getchar())!='\n'){
if(ch==EOF) return 0;//读取到EOF,结束程序(在win下ctrl+z即为输入EOF)
code[k++]=ch;
}
return 1;
}
//解码器-读取01串值
int readVal(int len){
int v=0,d=(2<<len-1);
char ch;
while((d/=2)>0){
if((ch=getchar())!='\n'){
v+=d*(ch-48);
}else{
d*=2;
}
}
return v;
}
//计算01串对应字符数组下标
int decode(int len){
int v=readVal(len);
if(v==(2<<len-1)-1){
return -1;
}
return v+(2<<len-1)-(len+1);
}
int main(){
while(inputchar()){
bool t=true;
int len=readVal(3);
while(t){
int f=decode(len);
if(f>=0){
putchar(code[f]);
}
else{
len=readVal(3);
if(len==0) break;
}
}
getchar();
t=true;
putchar('\n');
}
return 0;
}