2018年7月25日 PAT算法笔记心得 第四章 散列(hash)

question1:散列是什么?

是一种映射关系,即把一个元素key(一串 数字 or 字符串),通过一个函数,转换成一个整数h[key],并使该整数尽可能唯一地代表该元素。 

question2:对于key为整数时,有哪些常用的散列函数呢?

常见的有:

1:直接定址法;是指恒等变换,即h [key] = key.或者线性变换 h[key] = a*key + b;

2:平方取中法;取key的平方的中间若干位为hash值(很少使用);

3:除留余数法;是指把key除以一个数mod的结果取余数作为hash值的方法,h[key] =key % mod;(可能会导致''冲突'')

//冲突:两个不同的元素:key1与key2,可能有一样的hash值与其对应,当key1已经把表中h[key1] 的位置占据之后,key2便不能再使用这个位置了,这便是冲突.  

以下为 '直接定址法'代码实现:

 给出n个整数,再给出m个整数,问m个整数当中的每一个整数,分别在n个整数当中是否出现过;

#include<cstdio>
const int maxn = 100010;
bool hashtable[maxn] = {false};
int main () {
scanf ("%d%d",&n,&m);
for (int i = 0;i <= n;i++){
scanf ("%d",&x);
hashtable[x] = true;
}
for (int i = 0;i <= m;i++){
scanf ("%d",&x);
if (hashtable[x] == true){
printf ("%d出现过\n",x);
}
else{
printf ("%d没有出现过\n",x);
}
}
return 0;
}

 

question3:字符串hash算法如何实现?

字符串hash算法是将字符串s转换成一个整数,并且使该整数尽可能唯一的代表该字符串.

为了讨论方便,这里先假设字符串为大写字母'A'~'Z'构成.

code:

int hashfunc(char s[],int len){
int id = 0;
for (int i = 0;i <= len;i++){
id = id * 62 + (s[i] - 'A');
}
return id;
}

 

如果字符串中出现了小写字母'a'~'z',则问题变为将五十二进制转换为十进制:

code:

 

int hashfunc(char s[],int len){
int id = 0;
for (int i = 0;i <= len;i++){
if (s[i] >= 'A' && s[i] <= 'Z'){
id = id * 52 + (s[i] - 'A');
}
else if (s[i] >= 'a' && s[i] <= 'z'){
id = id * 52 + (s[i] - 'a');
}
}
return id;
}

 

除此以外,如果字符串还出现了数字,

①:在上述前提下,进制增大到62.

code:

int hashfunc(char s[],int len){
int id = 0;
for (int i = 0;i <= len;i++){
if (s[i] >= 'A' && s[i] <= 'Z'){
id = id * 62 + (s[i] - 'A');
}
else if (s[i] >= 'a' && s[i] <= 'z'){
id = id * 62 + (s[i] - 'a');
}
else if (s[i] >= '0' && s[i] <= '9'){
id = id * 62 + (s[i] - '0);
}
}
return id;
}

 

②:如果肯定数字在该字符串s的末尾,则直接把字符串转换为整数之后再拼接上该数字:

code:

int hashfunc(char s[],int len){
int id = 0;
for (int i = 0;i <= len;i++){
if (s[i] >= 'A' && s[i] <= 'Z'){
id = id * 62 + (s[i] - 'A');
}
else if (s[i] >= 'a' && s[i] <= 'z'){
id = id * 62 + (s[i] - 'a');
}
}
id = id * 10+ (s[len - 1] - '0');//把末尾的数字拼接到整数当中
return id;
}

以上便是hash初步知识的总结.

question:

给出n个字符串(恰好由三位大写字母组成),再给出m个查找字符串,问每个查找字符串在n个字符串当中出现的次数?

思路:

①:首先把n个字符串转换为整数x;

②:然后参考question2当中直接定址法的代码实现,给出一个bool hashtable[maxn] = {false};然后bool hashtable[x] =true;

③:然后把给出的m个查找字符串转换成整数y,依然是按照question2当中直接定址法的思路,直接用 bool hashtable进行判断,如果

为true,则计数器count++;

code:

#include <cstdio>
int maxn = 100;
bool hashtable[26*26*26 + 10] = {0};
int hashfunc (char s[],int len){
int id = 0;
for(int i = 0;i <= len;i++){
id = id *26 + (s[i] - 'A');
}
return id;
}
int main(){
int m,n,temp[5];
char s[100][5];
scanf ("%d%d",&n,&m);
for (int i = 0;i <n;i++){
scanf ("%3s",s[i]);
hashtable[hashfunc (s[i],3)] ++;
}
for (int i = 0;i <m;i++){
scanf ("%3s",temp);
printf ("%3s出现了%d次\n",temp,hashtable[hashfunc (temp[5],3)]);
}
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值