字符串的最大匹配问题

我看到有这样一道问题

是这样的有一个有ATGC组成的DNA序列:AAATAAATAAATAAATTTGCGATATATATATCGCGCGTAGGTAGGTAGGTAGGCGATTTCGATTTCGATTTCGATTTCGATTT
我们能很容易的看到序列内部有许多重复序列,AAATAAATAAAT,AAA,TTT,ATATATAT,CGCGCG,TAGGTAGGTAGGTAGG,CGATTTCGATTTCGATTTCGATTTCGATTT
我要问的问题是:如何在一个任意的DNA序列内部识别这些重复,并且以最大匹配的方式识别这些重复,例如重复AAATAAATAAAT, 而并不被看成是AAA,并且报告它们在序列中的位置,

看后我颇感兴趣,于是我他解决了,拿出来和大家分享

/*这个程序我修改了一下,现在编译应该没有问题了*/
#include<stdio.h>
#include<string.h>
#define WRONG -1
void substring(char*);
int getnum(char *s,char *s1);
int main(){
char str[] = "AAATAAATAAATAAATTTGCGATATATATATCGCGCGTAGGTAGGTAGGTAGGCGATTTCGATTTCGATTTCGATTTCGATTT";
substring(str);
getch();
return 0;
}
void substring(char *p)
{
/*
** point 出现位置, frequency 连着出现次数, maxlen 字符串长度
*/
int point,frequency=1,maxlen=0,i,j=0,k=0,n,fr=0,max=1,l;
char *temp,*s;
temp = (char*)malloc(500);/*从母字符串提取出来,与其比较的字符串*/
s = (char*)malloc(500); /*找到后要输出的字符串*/
for(j=0;p[j];)
{ /*从第一个位置(A)开始一直到最后一个(T)确定每一个位置的最大匹配数*/
for(k=0;p[k+j];k++)
{
for(l=0;l<=k;l++)
temp[l] = p[l+j];
temp[k+1] = '/0';

for(fr=n=0;temp[n]==p[k+n+1+j] && (temp[n] || p[k+n+1+j]);)
{
n++;
if(!temp[n])fr=n; /*这里要注意以下,相邻必须完全匹配 条件是必须的*/
}

if(fr>maxlen)point = j,maxlen = fr;
if(fr==maxlen)frequency++;


}
/*每一个位置确定完以后,要输出这个字符串,并输出出现的位置,和他出现的频率*/
for(i=0; i<maxlen;i++)
s[i] = p[point++];
s[i] = '/0';

max = getnum(p+j,s)*maxlen;
if(max <= 0)
{
max = 1;
}
if(getnum(p+j,s)>1){
printf("%s ",s);
printf(" point = %d frequency=%d",j,getnum(p+j,s));
printf("/n");
}
/*摇把指针跳到已经找到的匹配字符串的后面*/
j+=max;
maxlen = 0;point=0;

}
}
/*这个函数确定找到的字符串,在母字符串中以次(相邻)出现的频率*/
int getnum(char *s,char *s1)
{
/*这个地方时计算的连着出现的次数*/
int len1=strlen(s),len2=strlen(s1),sum=0,i;
char *p = s1;
if(len2>len1)return(WRONG);

for(;*s==*s1 && (*s || *s1);)
{
s++,s1++;
if(!*s1)
{
sum++;
s1 = p;
}
}
if(sum>1)return sum;
return WRONG;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值