蛋白质序列的相似性

#include<bits/stdc++.h>
using namespace std;
const int N=1e3+10,w1=2;

int h[N][N];
int x1,y1;
string pre1,pre2;
void dfs(int x,int y,string s1,string s2)
{
	if(h[x][y]==0) return;
	if(s2[x]==s1[y])
	{
		pre1+=s1[y],pre2+=s2[x];
		dfs(x-1,y-1,s1,s2);
	}
	else{
		int a=h[x-1][y-1],b=h[x-1][y],c=h[x][y-1];
		int maxv=max(a,max(b,c));
		bool zs=0,up=0,z=0;
		if(a==maxv) zs=1;
		if(b==maxv) up=1;
		if(c==maxv) z=1;
		if(zs)
		{
		pre1+=s1[y],pre2+=s2[x];
		dfs(x-1,y-1,s1,s2);
		}
		else if(up)
		{
			pre1+=s1[y],pre2+='_';
			dfs(x-1,y,s1,s2);
		}
		else if(z)
		{
			pre1+='_',pre2+=s2[x];
			dfs(x,y-1,s1,s2);
		}
	}
}

double nsw(string s1,string s2)
{
	
	int m=s1.size(),n=s2.size();
	
	cout<<n<<' '<<m<<endl;
	s1=" "+s1,s2=" "+s2;
	int res=0;
	for(int i=1;i<=n;i++)
	for(int j=1;j<=m;j++)
	{
		int &x=h[i][j];
		int t;
		if(s1[j]==s2[i]) t=3;
		else t=-3;
		x=max(h[i-1][j-1]+t,max(h[i-1][j]-w1,max(h[i][j-1]-w1,0)));
		if(res<x)
		{
			res=x;
			x1=i,y1=j;
		}
	}
	pre1="",pre2="";
	dfs(x1,y1,s1,s2);
	
	reverse(pre1.begin(),pre1.end());
	reverse(pre2.begin(),pre2.end());
	
	int cnt=0;
	for(int i=0;i<pre1.size();i++)
	if(pre1[i]==pre2[i]) cnt++;
	
	double ans=(cnt*1.0)/(sqrt(m*1.0)+sqrt(n*1.0));
	
	return ans;
}
int main()
{
	string s1,s2;
	printf("请输入第一个蛋白质序列: \n");
	cin>>s1;
	printf("请输入第二个蛋白质序列: \n");
	cin>>s2;
	
	double ans=nsw(s1,s2);
	ans+=nsw(s2,s1);
	ans=ans/2.0;
	
	printf("这两个蛋白质的相似性为:\n");
	printf("%.2f",ans);
	return 0;
}

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值