Hash
哈希就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
Hash函数
- 直接取余法:**F = (x + max) % size **
max:是一个很大的数,防止出现负数。
size: 是存储空间 - 平方取中法
- 叠加法
- …
####不同的值可能对应相同的hash
#####两种方法
- 将相同哈希的数据,用链表存放。(结构体中的指针next)
- 出现相同的hash,进行二次hash处理。
####关键代码:插入和查找 - 第一种
head数组保存散列值在edge数组中的索引,edge数组保存num(原值),sum(个数),next(上一个的索引)。
当拿到一个新节点,首先根据head索引查找edge中是否有这个值,如果有的sum++;没有就插入新的节点。更新这个索引。
//插入
void Insert(int num) {
//哈希函数
int key = Hash(num);
//head保留key在edge的索引
for (int i = head[key]; i != -1; i = edge[i].next) {
//找到num,sum加 1,没找到插入
if (edge[i].num == num) {
edge[i].sum++;
return;
}
}
//插入新的节点
edge[now].num = num;
edge[now].sum = 1;
edge[now].next = head[key];
head[key] = now++;
}
//查找
int find(int num) {
int key = Hash(num);
for (int i = head[key]; i != -1; i = edge[i].next) {
//找到返回sum
if (edge[i].num == num) {
return edge[i].sum;
}
}
//找不到返回 0
return 0;
}
- 第二种
memset(head, -1, sizeof(head));
memset(sum, 0, sizeof(sum));
//插入
void Insert(int num) {
//哈希函数
int key = Hash(num);
while (head[key] != -1 && head[key] != num) {
key = (key + n) % size;
}
head[key] = num;
sum[key]++;
}
int find(int num) {
int key = Hash(num);
while (head[key] != -1 && head[key] != num) {
key = (key + n) % size;
}
if (head[key] == -1) return 0;
if (head[key] == num) return sum[key];
}
- 对于第二种还可以改进结构体重载运算符
struct ac{
//大小自己调整,保证二进制全为 1
//size的大小任意,总能找到一个一个空间存放新的值
//mask太小会TLE(重复太多)
//不理解可以手动模拟,假设mask = 1,x = 1,2,3,4....
static const int mask = 0x7fffff;
//N >= size
int sum[N], vis[N];
void clear(){
memset(sum, 0, sizeof(sum));
}
int& operator [](int x){
int i;
for(i = x & mask; sum[i] && vis[i] != x; i = (i + 1) & mask);
vis[i] = x;
return sum[i];
}
}Hash;