反复折腾了POJ上的后缀数组

折腾了最长回文串,和模式串的匹配问题。


发现程序慢如狗!


POJ 3461 TLE


#include <cstdio>
#include <cstring>


const int max_strlen = 1200000 + 10;
char pattern[max_strlen], text[max_strlen];
int sa[max_strlen], tub[max_strlen], wa[max_strlen], wb[max_strlen], wv[max_strlen];
int R[max_strlen], height[max_strlen], rank[max_strlen];
int totlen, SA[max_strlen];
int plen, tlen;
bool cmp(int *r, int a, int b, int l)
{return r[a] == r[b] && r[a + l] == r[b + l];}


void da(int *r, int *sa, int n, int m)
{
	int i, j, p, *x = wa, *y = wb, *t;
	for (i = 0; i != m; ++ i)	tub[i] = 0;
	for (i = 0; i != n; ++ i)	++ tub[x[i] = r[i]];
	for (i = 1; i != m; ++ i)	tub[i] += tub[i - 1];
	for (i = n - 1; i >= 0; -- i)	sa[-- tub[x[i]]] = i;
	for (j = 1, p =1; p != n; m = p, j *= 2)
	{
		for (p = 0, i = n - j; i!= n; ++ i)	y[p ++] = i;	
		for (i = 0; i != n; ++ i)	if (sa[i] >= j)	y[p ++] = sa[i] - j;
		for (i = 0; i != n; ++ i)	wv[i] = x[y[i]];
		for (i = 0; i != m; ++ i)	tub[i] = 0;
		for (i = 0; i != n; ++ i)	++ tub[wv[i]];
		for (i = 1; i != m; ++ i)	tub[i] += tub[i - 1];
		for (i = n - 1; i >= 0; -- i)	sa[-- tub[wv[i]]] = y[i];
		for (t = x, x =y, y = t, p = 1, x[sa[0]] = 0, i = 1; i != n; ++ i)
			x[sa[i]] = cmp(y, sa[i], sa[i - 1], j) ? p - 1 : p ++;
	}
}

void calheight(int *r, int *sa, int n)
{
	int i, j, k = 0;
	for (i = 1; i <= n; ++ i)	rank[sa[i]] = i;
	for (i = 0; i != n; height[rank[i ++ ]] = k)
		for (j = sa[rank[i] - 1], k ? k -- : 0; r[i + k] == r[j + k]; ++ k);
}

void HZSZ()
{
	totlen = 0;
	for (int i = 0; i != plen; ++ i)	R[totlen ++] = pattern[i];
	R[totlen ++] = 4; //串分割符号
	for (int i = 0; i != tlen; ++ i)	R[totlen ++] = text[i];
	R[totlen] = 3; //结束符号
	da(R, SA, totlen + 1, 175);
	calheight(R, SA, totlen);
}

void doit()
{
	int pos = rank[0];
	int ans = 0;
	for (int i = pos; i >= 1; -- i)
	{
		if (height[i] < plen)	break;	
		++ ans;
	}
	for (int i = pos + 1; i <= totlen; ++ i)
	{
		if (height[i] < plen)	break;
		++ ans;	
	}
	printf("%d\n", ans);
}


int main()
{
	int n;
	scanf("%d\n", &n);
	while (n --)
	{
		gets(pattern);
		gets(text);	
		plen = strlen(pattern);
		tlen = strlen(text);
		HZSZ(); //cal出SA和height数组
		doit();
	}
	return 0;
}



POJ 3974,直接无法承受后缀数组所需要的内存空间,直接爆内存!

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;


const int max_strlen = 4000000  + 10;
char text[max_strlen];
int tub[max_strlen], wa[max_strlen], wb[max_strlen], wv[max_strlen];
int R[max_strlen], height[max_strlen], rank[max_strlen];
int totlen, SA[max_strlen];
int textlen;
bool cmp(int *r, int a, int b, int l)
{return r[a] == r[b] && r[a + l] == r[b + l];}


void da(int *r, int *sa, int n, int m)
{
	int i, j, p, *x = wa, *y = wb, *t;
	for (i = 0; i != m; ++ i)	tub[i] = 0;
	for (i = 0; i != n; ++ i)	++ tub[x[i] = r[i]];
	for (i = 1; i != m; ++ i)	tub[i] += tub[i - 1];
	for (i = n - 1; i >= 0; -- i)	sa[-- tub[x[i]]] = i;
	for (j = 1, p =1; p != n; m = p, j *= 2)
	{
		for (p = 0, i = n - j; i!= n; ++ i)	y[p ++] = i;	
		for (i = 0; i != n; ++ i)	if (sa[i] >= j)	y[p ++] = sa[i] - j;
		for (i = 0; i != n; ++ i)	wv[i] = x[y[i]];
		for (i = 0; i != m; ++ i)	tub[i] = 0;
		for (i = 0; i != n; ++ i)	++ tub[wv[i]];
		for (i = 1; i != m; ++ i)	tub[i] += tub[i - 1];
		for (i = n - 1; i >= 0; -- i)	sa[-- tub[wv[i]]] = y[i];
		for (t = x, x =y, y = t, p = 1, x[sa[0]] = 0, i = 1; i != n; ++ i)
			x[sa[i]] = cmp(y, sa[i], sa[i - 1], j) ? p - 1 : p ++;
	}
}

void calheight(int *r, int *sa, int n)
{
	int i, j, k = 0;
	for (i = 1; i <= n; ++ i)	rank[sa[i]] = i;
	for (i = 0; i != n; height[rank[i ++ ]] = k)
		for (j = sa[rank[i] - 1], k ? k -- : 0; r[i + k] == r[j + k]; ++ k);
}

void HZSZ()
{
	totlen = 0;
	R[totlen ++] = 5;//开头符号
	R[totlen ++] = 6;

	for (int i = 0; i != textlen; ++ i)	
	{
		R[totlen ++] = text[i];
		R[totlen ++] = 6; //字符中断符
	}
	R[totlen ++] = 4; //串分割符号
	R[totlen ++] = 6;
	for (int i = textlen - 1; i >=0 ; -- i)
	{
		R[totlen ++] = text[i];
		R[totlen ++] = 6;
	}
	R[totlen] = 3; //结束符号
	da(R, SA, totlen + 1, 175);
	calheight(R, SA, totlen);
}

struct node
{
	node *ls, *rs;	
	int key, L, R;
	node(int LL, int RR, int KEY, node *LS, node *RS)
	{
		ls = LS;
		rs = RS;
	 	L =LL;
		R = RR;	
		key = KEY;	
	}
	node()
	{
		ls = rs = this;	
		key = L = R = -1;
	}
}root, Tnull, *null = &Tnull;

void mt(node &now, int LL, int RR)
{
	if (LL == RR)	
	{
		now.key = height[LL];	
		return;
	}
	int mid = (LL + RR) / 2;
	if (now.ls == null)	now.ls = new node(LL, mid, 0, null, null);
	else {
		now.ls -> L = LL;
		now.ls -> R = mid;
	}
	if (now.rs == null)	now.rs = new node(mid + 1, RR, 0, null, null);
	else{
		now.rs -> L = mid + 1;
		now.rs -> R = RR;	
	}
	mt(*now.ls, LL, mid);
	mt(*now.rs, mid + 1, RR);
	int a =now.ls -> key;
	int b = now.rs -> key;
	now.key = min(a, b);	
	return;
}

int find(node &now, int LL, int RR)
{
	if (now.L == LL && now.R == RR)	return	now.key;
	int mid = (now.L + now.R) / 2;
	if (RR <= mid)	return find(*now.ls, LL, RR);
	if (mid < LL)	return find(*now.rs, LL, RR);
	int a = find(*now.ls, LL, mid);
	int b = find(*now.rs, mid + 1, RR);
	return min(a, b);
}

void doit()
{
	root = node(0, totlen, 0, null, null);
	mt(root, 0, totlen);
	int ans = 0;
	for (int i = 2; i <= 2 * textlen; ++ i)
	{
		int a = rank[i];
		int b = rank[totlen - i];
		if (a > b)	swap(a, b);
		int tmp = find(root, a + 1, b) - 1;
		ans = max(ans, tmp );
	}
	cout<<ans<<endl;
}

int main()
{
	int count=0;
	while (1)
	{
		++ count;
		gets(text);	
		if (text[0] == 'E')	break;
		cout<<"Case "<<count<<": ";
		textlen = strlen(text);
		HZSZ(); 
		doit();
	}
	return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
蛋白质是生物体中普遍存在的一类重要生物大分子,由天然氨基酸通过肽键连接而成。它具有复杂的分子结构和特定的生物功能,是表达生物遗传性状的一类主要物质。 蛋白质的结构可分为四级:一级结构是组成蛋白质多肽链的线性氨基酸序列;二级结构是依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋和β折叠;三级结构是通过多个二级结构元素在三维空间的排列所形成的一个蛋白质分子的三维结构;四级结构用于描述由不同多肽链(亚基)间相互作用形成具有功能的蛋白质复合物分子。 蛋白质在生物体内具有多种功能,包括提供能量、维持电解质平衡、信息交流、构成人的身体以及免疫等。例如,蛋白质分解可以为人体提供能量,每克蛋白质能产生4千卡的热能;血液里的蛋白质能帮助维持体内的酸碱平衡和血液的渗透压;蛋白质是组成人体器官组织的重要物质,可以修复受损的器官功能,以及维持细胞的生长和更新;蛋白质也是构成多种生理活性的物质,如免疫球蛋白,具有维持机体正常免疫功能的作用。 蛋白质的合成是指生物按照从脱氧核糖核酸(DNA)转录得到的信使核糖核酸(mRNA)上的遗传信息合成蛋白质的过程。这个过程包括氨基酸的活化、多肽链合成的起始、肽链的延长、肽链的终止和释放以及蛋白质合成后的加工修饰等步骤。 蛋白质降解是指食物中的蛋白质经过蛋白质降解酶的作用降解为多肽和氨基酸然后被人体吸收的过程。这个过程在细胞的生理活动中发挥着极其重要的作用,例如将蛋白质降解后成为小分子的氨基酸,并被循环利用;处理错误折叠的蛋白质以及多余组分,使之降解,以防机体产生错误应答。 总的来说,蛋白质是生物体内不可或缺的一类重要物质,对于维持生物体的正常生理功能具有至关重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值