实验目的
在数据加密和数据压缩中常需要对特殊的字符串进行编码。给定的字母表A由26个小写字母组成。该字母表产生的升序字符串中字母从左到右出现的次序与字母在字母表中出现的次序相同,且每个字符最多出现1次。例如,a,b,ab,bc,xyz等字符串都是升序字符串。现在对字母表中产生的所有长度不超过6的升序字符串,计算它在字典中的编码。
实验原理
使用分治算法,根据不同的输入用例,能准确的输出产生的所有长度不超过6的升序字符串,计算它在字典中的编码,并计算出程序运行所需要的时间。
实验步骤
①求出长度为1,2…n-1 的所有可能字符串排列的数目。
②将字符串分解,算出相同长度下小于本字符串的数目。
③将上述结果求和+1得到序列号。
④由于第一点中求解组合数之和是连续的,单独设计一个函数来求解。
算法时间复杂度
常数相加,为O(1)。
实验心得
通过这次实验,我学习了给字符串排序的分治算法,在其中加入了随机化过程,让我熟悉了随机化算法。
完整代码
字典序
#include<iostream>
#include<string>
#include<fstream>
#include<math.h>
#include<ctime>
using namespace std;
int Comb(int n,int m)//组合数
{
int res=1;
for(int i=1;i<=m;i++)
{
res=res*(n-i+1)/i;
}
return res;
}
int Comb_continuous(int n,int m)//计算一组连续的组合数之和
{
int sum=0,num=1;
for(int i=1;i<=m;i++)
{
num=num*n/i;
n--;
sum+=num;
}
return sum;
}
int sums(int len,string str)
{
int sum=0;
int index=0;
for(int i=0;i<len;i++)
{
for(int j=index;j<str[i]-'a';j++)
{
sum+=Comb(26-j-1,len-i-1);
}
index=str[i]-'a'+1;
}
return sum;
}
int main(){
ifstream in("input.txt");
ofstream out("output.txt");
string str;
int num,sum;
in>>num;//字符串数目
clock_t start,end;
start=clock();
while(num--)
{
in>>str;
int len = str.length();//取字符串长度
sum=Comb_continuous(26,len-1)+sums(len,str)+1;
out<<sum<<endl;
}
end=clock();
in.close();
printf("时间:%fms\n",(double)(end-start)/CLK_TCK);
out.close();
return 0;
}
随机数生成
#include<stdlib.h>
#include<time.h>
#include<fstream>
#include<iostream>
using namespace std;
int main()
{
int m;
cin>>m;
srand((int)time(NULL));
ofstream out;
out.open("input.txt");
out<<m<<endl;
for(int i=0;i<m;i++)
{
int n=rand()%6+1,num=0;
for(int j=0;j<n;j++)
{
num+=rand()%(26/n-1)+1;
char c=num+'a';
out<<c;
}
out<<endl;
}
out.close();
return 0;
}