每日总结 1.13

最新推荐文章于 2024-10-07 09:58:35 发布

不甘心蒟蒻呐

最新推荐文章于 2024-10-07 09:58:35 发布

阅读量79

点赞数

文章标签：哈希算法散列表算法

本文链接：https://blog.csdn.net/ddddcy2023/article/details/128680471

版权

1.今天刷了一题kmp还有一题hash

【模板】字符串哈希

题目描述

如题，给定 NN 个字符串（第 ii 个字符串长度为 M_iMi，字符串内包含数字、大小写字母，大小写敏感），请求出 NN 个字符串中共有多少个不同的字符串。

友情提醒：如果真的想好好练习哈希的话，请自觉。

输入格式

第一行包含一个整数 NN，为字符串的个数。

接下来 NN 行每行包含一个字符串，为所提供的字符串。

输出格式

输出包含一行，包含一个整数，为不同的字符串个数。

输入输出样例

输入 #1复制

5
abc
aaaa
abc
abcc
12345

输出 #1复制

说明/提示

对于 30\%30% 的数据：N\leq 10N≤10，M_i≈6Mi≈6，Mmax\leq 15Mmax≤15。

对于 70\%70% 的数据：N\leq 1000N≤1000，M_i≈100Mi≈100，Mmax\leq 150Mmax≤150。

对于 100\%100% 的数据：N\leq 10000N≤10000，M_i≈1000Mi≈1000，Mmax\leq 1500Mmax≤1500。

样例说明：

样例中第一个字符串(abc)和第三个字符串(abc)是一样的，所以所提供字符串的集合为{aaaa,abc,abcc,12345}，故共计4个不同的字符串。

Tip：感兴趣的话，你们可以先看一看以下三题：

BZOJ3097：http://www.lydsy.com/JudgeOnline/problem.php?id=3097

BZOJ3098：http://www.lydsy.com/JudgeOnline/problem.php?id=3098

BZOJ3099：http://www.lydsy.com/JudgeOnline/problem.php?id=3099

如果你仔细研究过了（或者至少仔细看过AC人数的话），我想你一定会明白字符串哈希的正确姿势的^_^

#include<stdio.h>
#include<string.h>
int len[1501];
int k[10000][10000];//记录字符存入散列表后的位置 
int hash[10000],hashh=0;
char str[10000][10000];
int main()
{
	long long int n;
	int cnt;
	scanf("%lld",&n);
	for(int i=1;i<=n;i++)
	{
		scanf("%s",str[i]);
		int L;
		L=strlen(str[i]);
		len[L]++;
		k[L][len[L]]=i;
		for(int j=1;j<=L;j++)
		{
			int A;
			A=str[i][j]-'0';
			hashh=hashh*10000+A;
		}
		hash[i]=hashh;
		for(int j=1;j<len[L];j++)
		{
			if(hash[k[L][j]]==hashh)
			{
				cnt++;
				break;
			}
		}
		hashh=0;
	}
	printf("%lld",n-cnt);
	getchar();
	getchar();
	return 0;
}

这个思路是后来才想出来的下面是一开始的思路只过了两个

#include<stdio.h>
#include<string.h>
#define N 10010
int a[N];
char str[N];
int n,count=1,t=121;
unsigned long long int mod=202240170506;
int hash(char str[])
{
	unsigned long long int k=0;
	for(int i=0;i<strlen(str);i++)
	{
		k=(k*t+(unsigned long long)str[i])%mod;
	}
	return k;
}
int main()
{
	int temp;
	scanf("%d",&n);
	for(int i=0;i<n;i++)
	{
		scanf("%s",str);
		a[i]=hash(str);
	}
	for(int i=0;i<n-1;i++)
	{
		for(int j=0;j<n-i;j++)
		{
			if(a[i]>=a[j])
			{
				temp=a[i];
				a[i]=a[j];
				a[j]=temp;
			}
		}
	}
	for(int i=0;i<n-1;i++)
	{
		if(a[i]!=a[i+1])
		{
			count++;
		}
	}
	printf("%d",count);
	getchar();
	getchar();
	return 0;
}

简单说一下这个思路，这个是典型的hash求余数的策略，其中用了一个冒泡排序对给各个数即hash数进行排序，验证是否求的hash值相邻的相等，就一个一个叠加，最后得出答案，可是仍然有bug，实在做不出来就换了一个思路，后来的思路就是开几个数组以单词长度作为匹配的标准在相同的长度单词中间进行判断可以减低匹配复杂度，两个思路用的都是hash里面比较基础的一个是取余法还有一个是ascll码值，用一个数组存储，进行做个判断，以ascll码值来作为最后的判断依据，双重判断条件降低重复可能性。

[BOI2009]Radio Transmission 无线传输

题目描述

给你一个字符串 s_1s1，它是由某个字符串 s_2s2 不断自我连接形成的。但是字符串 s_2s2 是不确定的，现在只想知道它的最短长度是多少。

输入格式

第一行一个整数 LL，表示给出字符串的长度。

第二行给出字符串 s_1s1 的一个子串，全由小写字母组成。

输出格式

仅一行，表示 s_2s2 的最短长度。

输入输出样例

输入 #1复制

8
cabcabca

输出 #1复制

说明/提示

样例输入输出 1 解释

对于样例，我们可以利用 \texttt{abc}abc 不断自我连接得到 \texttt{abcabcabc}abcabcabc，读入的 \texttt{cabcabca}cabcabca，是它的子串。

规模与约定

对于全部的测试点，保证 1 < L \le 10^61<L≤106。

#include<stdio.h>
#define N 1000010
int n,next[N];
char s[N];
int getnext()
{
	int i,j=0;
	for(i=1;i<n;)
	{
		while(i<n&&s[i]==s[j])
		{
			j++;
			next[i]=j;
			i++;
		}
		if(i>=n)
		{
			break;
		}
		j=next[j-1];
		while(i<n&&s[i]!=s[j]&&j==0)
		{
			i++;
		}
	}
}
int main()
{
	scanf("%d",&n);
	scanf("%s",s);
	getnext();
	printf("%d",n-next[n-1]);
	getchar();
	getchar();
	return 0;
}