这个在矩阵的专题里,不知道为什么,知道用LCS和并查集了就好做了。题意是给你N个DNA序列,两个DNA序列最长公共子串在DNA序列都大于给你的占总长度的百分比P,就属于同一个物种,问有多少个不同类物种。
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<vector>
#include<iostream>
#include<queue>
#include<list>
#include<cstdlib>
#pragma comment(linker, "/STACK:102400000,102400000")
#define db double
#define LL long long
const int maxn = 110;
int dp[maxn][maxn],used[maxn],par[maxn],rank[maxn],len[maxn];
double limit;
int n;
char str[maxn][maxn];
using namespace std;
void init(int n)
{
for(int i=0; i<=n; i++)
{
par[i]=i;
rank[i]=0;
}
}
int find(int x)
{
if(par[x]==x)
return x;
else return par[x]=find(par[x]);
}
void union_set(int x,int y)
{
x=find(x);
y=find(y);
if(x==y)
return ;
if(rank[x]<rank[y])
{
par[x]=y;
}
else
{
par[y]=x;
if(rank[x]==rank[y])rank[x]++;
}
}
int maxlen(int a,int b)
{
memset(dp,0,sizeof(dp));
int maxx = 0;
for(int i=1; i<len[a]; i++)
{
dp[i][0]=0;
for(int j=1; j<len[b]; j++)
{
if(str[a][i]==str[b][j])
{
dp[i][j]=dp[i-1][j-1]+1;
}
else dp[i][j]=0;
maxx=max(dp[i][j],maxx);
}
}
return maxx;
}
int main()
{
int kase = 1;
while(~scanf("%d %lf",&n,&limit))
{
memset(str,0,sizeof(str));
memset(len,0,sizeof(len));
init(n);
for(int i=0; i<n; i++)
{
str[i][0]=' ';
scanf("%s",str[i]+1);
len[i]=strlen(str[i]);
}
for(int i=0; i<n; i++)
for(int j=0; j<i; j++)
{
int x=find(i);
int y=find(j);
if(x==y)
continue;
int surlen=maxlen(i,j);
if((db)(db)surlen/(db)(len[i]-1)*100.0>limit&&(db)surlen/(db)(len[j]-1)*100.0>limit)
{
union_set(i,j);
}
}
int cnt=0;
for(int i=0; i<n; i++)
{
if(par[i]==i)
cnt++;
}
printf("Case %d:\n%d\n",kase++,cnt);
}
return 0;
}