SPOJ Lexicographical Substring Search 后缀自动机

给定一个字符串,取出所有的子串按照字典序排序并去重后,求第K大的子串。


以为自动机写错了。。后来发现是DP出的问题。 后缀自动机先告一段落,整理点东西出来吧!比赛时候出裸题,我得保证能做出来才行。


#include <iostream>
#include <cstring>
#include <cstdlib>
#include <cstdio>
using namespace std;


const int CHAR = 26;
const int MAXN = 250000 * 2  + 100;
char str[MAXN];

bool duanyan(bool flag, const string &x)
{
	if (!flag)
	{
		cout << x << endl;
		throw 0;
		exit(0);
	}
}

struct SAM_Node
{
	SAM_Node *fa, *next[CHAR];
	int len;
	int id, pos;
	long long dp;
	SAM_Node(){}
	SAM_Node(int _len)
	{
		fa = 0;
		len = _len;
		dp=0;
		memset(next, 0, sizeof(next));
	}
};

SAM_Node SAM_node[MAXN *2], *SAM_root, *SAM_last;
int SAM_size;

SAM_Node * newSAM_Node(int len)
{
	SAM_node[SAM_size] = SAM_Node(len);
	SAM_node[SAM_size].id = SAM_size; 
	SAM_node[SAM_size].dp = 0; 
	return &SAM_node[SAM_size++];
}

SAM_Node *newSAM_Node(SAM_Node *p)
{
	SAM_node[SAM_size] = *p;
	SAM_node[SAM_size].id = SAM_size;
	SAM_node[SAM_size].dp = 0; 
	return &SAM_node[SAM_size++];
}

void SAM_init()
{
	SAM_size = 0;
	SAM_root = SAM_last = newSAM_Node(0);
	SAM_node[0].pos = 0;
}

void SAM_add(int x, int len)
{
	SAM_Node *p = SAM_last, *np = newSAM_Node(p -> len+1);
	np -> pos = len;
	SAM_last = np;
	for (;p && !p -> next[x]; p = p -> fa)
		p -> next[x] = np;
	if (!p)
	{
		np -> fa = SAM_root;
		return;
	}
	SAM_Node *q = p -> next[x];
	if (q -> len == p-> len+1)
	{
		np -> fa = q;
		return;
	}
	SAM_Node *nq = newSAM_Node(q);
	nq -> len = p -> len + 1;
	q -> fa = nq;
	np -> fa = nq;
	for (;p && p-> next[x] == q; p = p -> fa)
		p -> next[x] = nq;
}

int topcnt[MAXN];
SAM_Node *topsam[MAXN*2];

void SAM_build(char *s)
{
	SAM_init();
	int len = strlen(s);
	for (int i = 0 ;i < len; ++ i)
		SAM_add(s[i] - 'a' , i + 1);
}

int g[MAXN], f[MAXN];

void pg()
{

	for (int i = 0; i < SAM_size; ++ i)
	{
		cout <<"@"<< SAM_node[i].id<< endl;
		for (int j = 0; j < 26; ++ j)
		{
			if (SAM_node[i].next[j])
			{
				cout << SAM_node[i].next[j] -> id << endl;
			}
		}
		if (i)
		cout << "fa: " << SAM_node[i].fa -> id << endl;
		cout<<"===="<<endl;
	}
}

void find(SAM_Node* now, long long k)
{
	while (k)
	{
		//--k;
		for (int i = 0; i < 26; ++ i)
		{
			if (now -> next[i])
			{
				if (k <= (now -> next[i] -> dp))
				{
					putchar(i+'a');	//	TODO
					now = now -> next[i];
					--k; //why here???
					break;
				}
				else
				{
					k -= now -> next[i] -> dp;
				}
			}
		}
	}
	putchar('\n');
}

int main()
{
	int t;
	scanf("%s", str);
	SAM_build(str);
	int n = strlen(str);

	memset(topcnt, 0, sizeof(topcnt));
	for (int i = 0; i < SAM_size; ++ i)
		topcnt[SAM_node[i].len] ++ ;
	for (int i = 1; i <= n; ++ i)
		topcnt[i] += topcnt[i - 1];
	for (int i = 0; i < SAM_size ; ++ i)
		topsam[-- topcnt[SAM_node[i].len]] = &SAM_node[i];
	for (int i = 1; i < SAM_size; ++ i)
		SAM_node[i].dp = 1;


	for (int i = SAM_size -1; i>=0; -- i)
	{
		SAM_Node *now = topsam[i];

		for (int i = 0; i < 26; ++ i)
		{
			if (now->next[i])
			{
				now->dp += now->next[i]->dp;
			}
		}
	}

	scanf("%d", &t);
	pg();
	while (t--)
	{
		long long k;
		scanf("%lld", &k);
		//if (k> SAM_root->dp)	continue;
		find(SAM_root, k);
		//cout<<"=========================="<<endl;
	}
	return 0;
}



Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值