#include<bits/stdc++.h>
using namespace std;
const int N=1e3+10,w1=2;
int h[N][N];
int x1,y1;
string pre1,pre2;
void dfs(int x,int y,string s1,string s2)
{
if(h[x][y]==0) return;
if(s2[x]==s1[y])
{
pre1+=s1[y],pre2+=s2[x];
dfs(x-1,y-1,s1,s2);
}
else{
int a=h[x-1][y-1],b=h[x-1][y],c=h[x][y-1];
int maxv=max(a,max(b,c));
bool zs=0,up=0,z=0;
if(a==maxv) zs=1;
if(b==maxv) up=1;
if(c==maxv) z=1;
if(zs)
{
pre1+=s1[y],pre2+=s2[x];
dfs(x-1,y-1,s1,s2);
}
else if(up)
{
pre1+=s1[y],pre2+='_';
dfs(x-1,y,s1,s2);
}
else if(z)
{
pre1+='_',pre2+=s2[x];
dfs(x,y-1,s1,s2);
}
}
}
double nsw(string s1,string s2)
{
int m=s1.size(),n=s2.size();
cout<<n<<' '<<m<<endl;
s1=" "+s1,s2=" "+s2;
int res=0;
for(int i=1;i<=n;i++)
for(int j=1;j<=m;j++)
{
int &x=h[i][j];
int t;
if(s1[j]==s2[i]) t=3;
else t=-3;
x=max(h[i-1][j-1]+t,max(h[i-1][j]-w1,max(h[i][j-1]-w1,0)));
if(res<x)
{
res=x;
x1=i,y1=j;
}
}
pre1="",pre2="";
dfs(x1,y1,s1,s2);
reverse(pre1.begin(),pre1.end());
reverse(pre2.begin(),pre2.end());
int cnt=0;
for(int i=0;i<pre1.size();i++)
if(pre1[i]==pre2[i]) cnt++;
double ans=(cnt*1.0)/(sqrt(m*1.0)+sqrt(n*1.0));
return ans;
}
int main()
{
string s1,s2;
printf("请输入第一个蛋白质序列: \n");
cin>>s1;
printf("请输入第二个蛋白质序列: \n");
cin>>s2;
double ans=nsw(s1,s2);
ans+=nsw(s2,s1);
ans=ans/2.0;
printf("这两个蛋白质的相似性为:\n");
printf("%.2f",ans);
return 0;
}
蛋白质序列的相似性
最新推荐文章于 2024-11-01 17:00:11 发布