题目2 : 字符串压缩
-
2 3 1b1c1b2c5a2r3t 3c2b5a1r3t1r 2 20a20b10a20b10a 20a20b20a20b
样例输出
-
Case 1: Yes Case 2: No
描述
你的硬盘上有一个神秘的文件占用了大量空间,你决定将其压缩以节省空间。不幸的是,你还没有安装任何压缩软件,所以你决定自己编写一个压缩程序。你发现这是一个文本文件,包括很多行。每行是一个长度恰好为L的字符串,而且字符串可能有重复。行的顺序并不重要,换言之,打乱顺序之后仍然可以认为文件内容和原来相同。
例如,这个文件的内容可以是这样的:
bar
car
bat
cat
cat
经过一段时间观察,你发现同一列的字符往往是相同的,于是你设计了一个简单的压缩框架。首先以某种策略调整行的顺序,然后把所有字符串按照先列后行的顺序变换成单个字符串,例如上面的例子,不调整顺序则直接变换成:
bcbccaaaaarrttt
然后使用游程编码(RLE)的到压缩变换后的字符串:
1b1c1b2c5a2r3t
当然也可以先调换顺序:
car
cat
cat
bat
bar
这样的压缩字符串为:
3c2b5a1r3t1r
比不调整顺序的稍短一些。
现在,你已经得到了两个不同的压缩字符串,你想知道他们解压后的文件是否相同,请写一个程序解决这个问题。
输入
第一行是一个整数T (T <= 30),表示测试数据组数。
每组测试数据占三行。第一行为整数L,表示原始文件中每一行字符串的长度。第二行和第三行分别是两个压缩字符串,格式如c1 n1 c2 n2 … cMnM,表示字符ci连续出现了ni次。具体格式见样例。输入字符串只含a到z的小写字母,确保压缩字符串合法有效,且不为空。
输出
对每组测试数据,首先输出”Case x: ”,其中x表示测试数据编号。如果两个压缩字符串对应于相同的文件内容,则输出”Yes”,否则输出”No”。
数据范围
小数据:1<=L<=10, 1<=ni<=100,压缩字符串长度不超过10^4
大数据:1<=L<=1000, 1<=ni<=10^9,压缩字符串长度不超过10^6
在比赛结束后,很久,才把代码写出来。不知道是否正确,只是能够测试样例得到正确结果。也不考虑什么复杂度问题了。贴出来,大家看看。不对地方请留言。
真是弱爆了。
祝贺进入复赛的同志。
//source here
#include <iostream>
#include <vector>
#include <cstdio>
#include <algorithm>
#include <math.h>
using namespace std;
char a[1000009],b[1000009];
struct myclass {
bool operator() (const vector<char> a ,const vector<char> b)
{
int len=a.size();
if(a[0]==b[0])
{
if(len>1)
return( a[1]<b[1]);
}
return( a[0]<b[0]);
}
} myobject;
int main()
{
freopen("a.txt","r",stdin);//貌似正常比赛时不应该有
int icase;
cin>>icase;
for(int k=1;k<=icase;++k)
{
int ilen;
cin>>ilen;
int flag_yes=1; //表示两者相同,输出yes
memset(a,0,sizeof(a));
memset(b,0,sizeof(b));
cin>>a;
cin>>b;
vector<char> astr;//存储完整的字符串
vector<char> bstr;
vector< vector<char> > ares,bres;
//vector<char>表示一行字符
int inum;
inum=0;
for(int i=0;a[i]!='\0'&&a[i]!=NULL;++i)
{
if(a[i]>='0'&&a[i]<='9')
inum=inum*10+a[i]-'0';
else
{
astr.insert(astr.end(),inum,a[i]);
inum=0; //
}
}
inum=0;
for(int i=0;b[i]!='\0'&&b[i]!=NULL;++i)
{
if(b[i]>='0'&&b[i]<='9')
inum=inum*10+b[i]-'0';
else
{
bstr.insert(bstr.end(),inum,b[i]);
inum=0;
}
}
long long asize=astr.size();
long long bsize=bstr.size();
if(asize!=bsize)
{
cout<<"Case "<<k<<':'<<" No"<<endl;
flag_yes=0;
continue;
}
long long cols=asize/ilen;
for(int i=0;i<cols;i++)
{
vector<char> temp;
for(int j=0;j<ilen;j++)
temp.push_back(astr[i+j*cols]);
ares.push_back(temp);
}
for(int i=0;i<cols;i++)
{
vector<char> temp;
for(int j=0;j<ilen;j++)
temp.push_back(bstr[i+j*cols]);
bres.push_back(temp);
}
sort(ares.begin(),ares.end(),myobject);
sort(bres.begin(),bres.end(),myobject); //排序后,便于顺序查找
vector<vector<char>>::iterator it1, it2;
for(int i=0;i<cols;i++)
{
it1=ares.begin();
it2=bres.begin();
while(*it1!=NULL&&*it2!=NULL&&*it1!=*it2)
{
it2++;
if((*it1)[0]!=(*it2)[0])
{ //两者都已经排序,如果首字母不同
//后面不可能包含与*it1首字母相同的行字符串
flag_yes=0;
break;
}
}
if(*it1!=*it2)
{
cout<<"Case "<<k<<':'<<" No"<<endl;
flag_yes=0;
break;
}
else
{
ares.erase(it1);
bres.erase(it2);
}
}
if(flag_yes)
cout<<"Case "<<k<<':'<<" Yes"<<endl;
}
}