hash map
链表:
链表将数据串联起来,通过链表头的指针来访问next/prev的链表节点.
更改链表节点的前后指向关系可以增加/删除链表节点.
http://blog.csdn.net/qq_21358401/article/details/79266329
哈希表:
哈希表根据键值访问的数据结构,通过映射关系将数据保存到表中.
访问数据时同样的映射规则可以轻易得知对应的保存数据.
数据保存位置=f(数据)
f是哈希函数,映射数据得到对应的保存位置.
哈希表的原理
假设有一百个不大于10的数据 需要统计出其中个数最多的数(数目相同则数值最大)
array[] = 0 1 2 3 3 2 4 5 6 7 8 9 1 2 3 4 ......
最简单的做法是这样的 int array_size[10];
for (int i = 0; i < 100; i++) {
array_size[array[i]]++;
}
这样array_size就统计出了各个数的数目,再选出数目最多的数就得到结果.
array_size就是最简单的哈希表.
根据array中的数据的数值散列到array_size对应元素上,是这个表的映射关系.
撞桶
输入数据经过映射被存储到对应的位置
一个不可避免的问题是:1. 不同的输入数据被映射到相同的位置
2. 相同的输入数据不止一个
一个解决方法是哈希表结合链表:
每一个桶对应一个链表,同样的数据按顺序插入在链表之中.
这样就解决了撞桶的问题,但同样的失去了哈希表的快捷性.
解决问题
求出一个网站中每天访问量最大的IP.
思路: IP从 0.0.0.0 - 255.255.255.255有256*256*256*256种变化
将IP转化为字符串,通过字符串哈希函数比如elfhash算法转化为键值
哈希表由链表来实现:
hash map:
哈希链表head
|
10.10.10.1->a->b->c
|
10.10.10.2->a->b->c
|
10.10.10.3->a->b->c
这样根据映射的键值来插入新的链表节点,不需要备齐所有ip的键值
散列所有数据后根据对应键值的链表长度就可以得到访问量最大的ip
示例实现
https://github.com/sliver-chen/codingutil/tree/master/data_struct/hash_table