CF528D Fuzzy Search FFT

有两个基因串S和T,他们只包含AGCT四种字符。现在你要找出T在S中出现了几次。 有一个门限值k≥0。T在S的第i(1≤i≤|S|-|T|+1)个位置中出现的条件如下:把T的开头和S的第i个字符对齐,然后T中的每一个字符能够在S中找到一样的,且位置偏差不超过k的,那么就认为T在S的第i个位置中出现。也就是说对于所有的 j (1≤j≤|T|),存在一个 p (1≤p≤|S|),使得|(i+j-1)-p|≤k 和[p]=T[j]都成立。 例如,根据这样的定义"ACAT"出现在"AGCAATTCAT"的第2,3和6的位置。

如果k=0,那么这个就是经典的字符串匹配问题。 现在给定门限和两个基因串S,T,求出T在S中出现的次数。

Input 单组测试数据。 第一行有三个整数 |S|,|T|,k (1≤|T|≤|S|≤200000, 0≤k≤200000),表示S的长度,T的长度,门限值。 第二行给出基因串S。 第三行给出基因串T。 两个串都只包含大写字母'A', 'T', 'G' 和'C'。 Output 输出一个整数,表示T在S中出现的次数。

题解:如果题中给定的 $k$ 等于 $0$ 的话就是一道 $SAM/KMP/AC$自动机模板题了
 
有了 $k$ 的限制就让问题的难度提高了一个层次
 
发现字符集大小只有 $4$,我们枚举每种字符依次考虑
 
对于字符 $h$
 
令 $a_{i}$ 表示 $S$ 中第 $i$ 位是否能匹配上 $h$
 
令 $b_{i}$ 表示 $T$ 中第 $i$ 位是否是 $h$ 
 
令 $C_{j}=\sum_{i=0}^{|T|-1}b_{i}a_{j+i}$,若 $C_{j}=T$ 中 $h$ 数量则 $h$ 是满足要求的
 
然而上式 $C_{j}=\sum_{i=0}^{|T|-1}b_{i}a_{j+i}$ 的下标和是不固定的,翻转 $b$
 
得 $b_{i}\Rightarrow b_{|T|-1-i}$ 则 $C_{j}=\sum_{i=0}^{|T|-1}b_{|T|-1-i}a_{j+i}$
 
下标和为 $|T|-1+j$ ,是固定的
 
将上述过程作用于 $4$ 个字符,若 $\sum C_{j}=|T|$ 则 $j$ 位置是合法的
#include<bits/stdc++.h>
#define setIO(s) freopen(s".in","r",stdin) 
#define ll long long 
#define maxn 800002  
using namespace std;
const double pi=acos(-1.0);  
inline int get(char c)
{
	if(c=='A') return 1; 
	if(c=='T') return 2; 
	if(c=='G') return 3; 
	if(c=='C') return 4; 
} 
struct cpx 
{
	double x,y; 
	cpx(double a=0,double b=0) {x=a,y=b; } 
	cpx operator+(const cpx b) { return cpx(x+b.x,y+b.y); } 
	cpx operator-(const cpx b) { return cpx(x-b.x,y-b.y); } 
	cpx operator*(const cpx b) { return cpx(x*b.x-y*b.y,x*b.y+y*b.x); }
}A[maxn],B[maxn];      
void FFT(cpx *a,int n,int flag) 
{
	for(int i=0,k=0;i<n;++i) 
	{
		if(i>k) swap(a[i],a[k]); 
		for(int j=(n>>1);(k^=j)<j;j>>=1); 
	}
    for(int mid=1;mid<n;mid<<=1) 
    { 
    	cpx wn(cos(pi/mid), flag*sin(pi/mid)),x,y; 
    	for(int i=0;i<n;i+=(mid<<1)) 
    	{
    		cpx w(1,0); 
    		for(int j=0;j<mid;++j) 
    		{
    			x=a[i+j], y=w*a[i+j+mid];  
    			a[i+j]=x+y,a[i+j+mid]=x-y;           
    			w=w*wn; 
    		}
    	}
    }
    if(flag==-1) for(int i=0;i<n;++i) a[i].x/=(double)n;     
} 
int len_s,len_t,k; 
int a[10][maxn],b[10][maxn],answer[10][maxn];    
int S[maxn],T[maxn];   
char srr[maxn],trr[maxn];     
inline void Initialize(int h)
{
	int cnt=0; 
	for(int i=0;i<len_s;++i) 
	{   
		cnt+=(S[i]==h);   
		if(i-k-1>=0) cnt-=(S[i-k-1]==h); 
		if(cnt) a[h][i]=1;  
	} 
	cnt=0; 
	for(int i=len_s-1;i>=0;--i) 
	{
		cnt+=(S[i]==h); 
		if(i+k+1<len_s) cnt-=(S[i+k+1]==h); 
		if(cnt) a[h][i]=1;  
	}
}
inline void solve(int h,int len)
{ 
	for(int i=0;i<len;++i) A[i].x=A[i].y=B[i].x=B[i].y=0;   
	for(int i=0;i<len;++i) A[i].x=a[h][i];    
	for(int i=0;i<len;++i) B[i].x=b[h][len_t-1-i];
	FFT(A,len,1),FFT(B,len,1); 
	for(int i=0;i<len;++i) A[i]=A[i]*B[i]; 
	FFT(A,len,-1);  
	for(int i=0;i<len_s;++i) answer[h][i]=(ll)(A[len_t-1+i].x+0.5);      
}
int main()
{
	//  setIO("input");   
	scanf("%d%d%d",&len_s,&len_t,&k);     
	scanf("%s%s",srr,trr);   
	for(int i=0;i<len_s;++i) S[i]=get(srr[i]); 
	for(int i=0;i<len_t;++i) T[i]=get(trr[i]);
	for(int i=0;i<len_t;++i) b[T[i]][i]=1;        
	for(int i=1;i<=4;++i) Initialize(i);            
	int len; 
	for(len=1;len<=(len_s+len_t);len<<=1);    
	for(int i=1;i<=4;++i) solve(i,len);   
	int re=0; 
	for(int i=0;i<len_s;++i) if(answer[1][i]+answer[2][i]+answer[3][i]+answer[4][i]>=len_t) ++re; 
	printf("%d\n",re);       
	return 0;  
}

  

转载于:https://www.cnblogs.com/guangheli/p/11170862.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
后台采用apache服务器下的cgi处理c语言做微信小程序后台逻辑的脚本映射。PC端的服务器和客户端都是基于c语言写的。采用mysql数据库进行用户数据和聊天记录的存储。.zip C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值