codevs3013单词背诵--字符串哈希，线型探测哈希

最新推荐文章于 2022-09-13 12:27:26 发布

lengxuenong

最新推荐文章于 2022-09-13 12:27:26 发布

阅读量546

点赞数

分类专栏：数据结构哈希文章标签： hash map

本文链接：https://blog.csdn.net/lengxuenong/article/details/52781361

版权

数据结构同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

哈希

4 篇文章 0 订阅

订阅专栏

听了zhx的字符串哈希，很有收获，来一发。

最省事的思路当他是map了，第一问，直接Map解决，查询M次的时间复杂度mlog（n），第二问，从左侧找出所以单词的区间，用类似滑动窗口和桶排序处理左右端点。

#include<iostream>
#include<string>
#include<cstring>
#include<map> 
#include<cmath>
using namespace std;
const int maxm=100009;
int n,m;
int b[maxm],cword,fword[1009];
map<string,int>mp;
void read(){
	cin>>n;
	string s;
	for(int i=1;i<=n;i++){
		cin>>s;
		mp[s]=i;
	}
	cin>>m;
	for(int i=1;i<=m;i++){
		cin>>s;
		if(mp.count(s)){
			int tp=mp[s];
			if(!fword[tp])cword++,fword[tp]=1;
			b[i]=tp;			
		}
		else b[i]=0;
	}
	cout<<cword<<endl;
} 
int work(){
	int l=0,r=0,ans=maxm,cnt=0;
	memset(fword,0,sizeof(fword));
	while(l<=r){
		while(r<m){
			r++;
			if(b[r]==0){continue;}			
			fword[b[r]]++;	
			if(fword[b[r]]==1)cnt++;					
			if(cnt==cword)break;
						
		}
		while(l<=r){
			if(b[l]==0){l++;continue;}
			if(fword[b[l]]>1)fword[b[l]]--,l++;
			if(fword[b[l]]==1)break;
		}
		
		ans=min(ans,r-l+1);
	//	cout<<"l,r"<<l<<" "<<r<<" "<<ans<<endl;
		if(r>=m)break;
	}
	return ans;
}
int main(){

	read();
	cout<<work()<<endl;
}

然后将map改成了个特点简单的哈希，顺便用了m做模数，结果竟然只错了一个点

#include<iostream>
#include<string>
#include<cstring>
#include<map> 
#include<cmath>
using namespace std;
const int maxm=100007;
int n,m;
int a[1007],b[maxm],cword,fword[maxm],hash[maxm];
int strhash(string s){
	int ls=s.length();
	int val=0;
	for(int i=0;i<ls;i++)
		val=(val*107+(s[i]-20))%maxm;
	return val;
}
map<string,int>mp;
void read(){
	cin>>n;
	string s;
	for(int i=1;i<=n;i++){
		cin>>s;
		a[i]=strhash(s);
		hash[a[i]]=true;
	}
	cin>>m;
	for(int i=1;i<=m;i++){
		cin>>s;
		int tp=strhash(s);
		if(hash[tp]){		
			if(!fword[tp])cword++,fword[tp]=1;
			b[i]=tp;			
		}
		else b[i]=0;
	}
	cout<<cword<<endl;
} 
int work(){
	int l=0,r=0,ans=maxm,cnt=0;
	memset(fword,0,sizeof(fword));
	while(r<m){
		while(r<m){
			r++;
			if(b[r]==0){continue;}			
			fword[b[r]]++;	
			if(fword[b[r]]==1)cnt++;					
			if(cnt==cword)break;
						
		}
		while(l<=r){
			if(b[l]==0){l++;continue;}
			if(fword[b[l]]>1)fword[b[l]]--,l++;
			if(fword[b[l]]==1)break;
		}
		
		ans=min(ans,r-l+1);
	//	cout<<"l,r"<<l<<" "<<r<<" "<<ans<<endl;
		if(r>=m)break;
	}
	return ans;
}
int main(){

	read();
	cout<<work()<<endl;
}

将模数扩大了10倍，然后AC了。

但是zhx说了，应用不要用单模，所有又改成了双模的，第一次写，很丑。

#include<iostream>
#include<string>
#include<cstring>
#include<map> 
#include<cmath>
using namespace std;
const int maxm=100007;
int   mm[2]={99991,100007};
int n,m;
int a[1007],cword,fword[maxm][2]={0},hasha[maxm][2]={0};
struct node{int v1,v0;}v,tv,b[maxm];
node strhash(string s){
	int ls=s.length();
	tv.v0=0;tv.v1=0;
	for(int i=0;i<ls;i++){
		tv.v0=(tv.v0*107+(s[i]-20))%mm[0];
		tv.v1=(tv.v1*107+(s[i]-20))%mm[1];
	 }
	return tv;
}

void read(){
	cin>>n;
	string s;
	for(int i=1;i<=n;i++){
		cin>>s;
		tv=strhash(s);
		hasha[tv.v0][0]=1;
		hasha[tv.v1][1]=1;
		//cout<<tv.v0<<" "<<tv.v1<<endl;
	}
	cin>>m;
	for(int i=1;i<=m;i++){
		cin>>s;
		 tv=strhash(s);
		// cout<<"m-- "<<tv.v0<<" "<<tv.v1<<endl;
		if(hasha[tv.v0][0]&&hasha[tv.v1][1]){		
			if(fword[tv.v0][0]==0&&fword[tv.v1][1]==0)
				cword++,fword[tv.v0][0]=1,fword[tv.v1][1]=1;
			b[i]=tv;	
			//cout<<"cw"<<endl;
		}
		else b[i].v1=0,b[i].v0=0;
	//	cout<<b[i]<<" ";
	}
	cout<<cword<<endl;
} 
int work(){
	int l=0,r=0,ans=maxm,cnt=0;
	memset(fword,0,sizeof(fword));
	while(r<m){
		while(r<m){
			r++;
			if(b[r].v0==0&&b[r].v1==0){continue;}			
			fword[b[r].v0][0]++,fword[b[r].v1][1]++;	
			if(fword[b[r].v0][0]==1&&fword[b[r].v1][1]==1)cnt++;
			<span style="font-family: Arial, Helvetica, sans-serif;"> if(cnt==cword)break;</span><span style="font-family: Arial, Helvetica, sans-serif;">			</span>
		}
		while(l<=r){
			if(b[l].v0==0&&b[l].v1==0){l++;continue;}
			if(fword[b[l].v0][0]>1&&fword[b[l].v1][1]>1)
				fword[b[l].v0][0]--,fword[b[l].v1][1]--,l++;
			if(fword[b[l].v0][0]==1&&fword[b[l].v1][1]==1)break;
		}
		
		ans=min(ans,r-l+1);
	
		if(r>=m)break;
	}
	return ans;
}
int main(){

	read();
	cout<<work()<<endl;
}

hzw在做这个题的时候用了线型探测哈希的方法，顺便理解下。

线性探测法构造哈希表的一个具体例子：
http://blog.163.com/wf_shunqiziran/blog/static/1763072092012612114126231/
已知一组关键字为(39，49，54，38，44，28，68，12，06，77)，用除余法构造散列函数，用线性探查法解决冲突构造这组关键字的散列表。
　　解答:为了减少冲突，通常令装填因子α<l。这里关键字个数n=10，不妨取m=13，此时α≈0.77，散列表为T[0..12]，散列函数为：h(key)=key％13。
　由除余法的散列函数计算出的上述关键字序列的散列地址为(0，10，2，12，5，2，3，12，6，12)。

　前5个关键字插入时，其相应的地址均为开放地址，故将它们直接插入T[0]，T[10)，T[2]，T[12]和T[5]中。

　当插入第6个关键字15时，其散列地址2(即h(15)=15％13=2)已被关键字41(15和41互为同义词)占用。故探查h1=(2+1)％13=3，此地址开放，所以将15放入T[3]中。

　当插入第7个关键字68时，其散列地址3已被非同义词15先占用，故将其插入到T[4]中。

　当插入第8个关键字12时，散列地址12已被同义词38占用，故探查hl=(12+1)％13=0，而T[0]亦被26占用，再探查h2=(12+2)％13=1，此地址开放，可将12插入其中。

　类似地，第9个关键字06直接插入T[6]中；而最后一个关键字77插人时，因探查的地址12，0，1，…，6均非空，故77插入T[7]中。

hzw代码在这里：http://hzwer.com/2135.html

lengxuenong

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
codevs3013单词背诵--字符串哈希，线型探测哈希

听了zhx的字符串哈希，很有收获，来一发。最省事的思路当他是map了，第一问，直接Map解决，查询M次的时间复杂度mlog（n），第二问，从左侧找出所以单词的区间，用类似滑动窗口和桶排序处理左右端点。#include#include#include#include #includeusing namespace std;const int maxm=100009;int n,
复制链接

扫一扫