海量数据处理技术(1): 散列技术

最新推荐文章于 2022-04-17 21:45:28 发布

_hawkcoder

最新推荐文章于 2022-04-17 21:45:28 发布

阅读量610

点赞数

分类专栏：海量数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012733215/article/details/46382025

版权

海量数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

海量数据处理技术(1): 散列技术

Hash,音译“哈希”，也称为散列表。它是将任意的输入通过映射函数映射到一个指定的输出空间。该映射函数函数称为hash函数，指定的输出空间称为hash表。通常是将一个大的数据集映射到一个小的数据集上。hash技术常用于字典或数据库等key-value系统中，将Key通过hash函数映射到hash表中，然后在该映射位置存储value的值（或者存储指向value的指针），这样在查找时，便只需对key进行hash一次便得到了它对应的value存储的位置。hash的一般映射关系如下，并维基百科上借用张图来说明下:

h : k e y \to T {0, 1, 2..., m - 1}

$h:key\to T\{0,1,2...,m-1\}$

这里写图片描述

查找复杂度

在一些合理的假设下，在散列表中查找一个元素的的期望时间为 $O(1)$
最坏的情况下，查找一个元素的时间为 $O(n)$ ，在所有的key都映射到一个地址上面了，此时hash表的性能和链表一样。

它有如下的特点：

对于不同关键字可能得到相同的散列地址，即 $key1 \neq key2$ 存在 $h(key1) = h(key2)$ ，这种情况叫做冲突Collision。每一个hash函数都可能出现这种情况，所以在设计时必须考虑如何解决冲突处理。
同一hash函数，对于不同的散列地址其关键字一定不同。

(1) hash函数的构造

好的hash函数一般有如下的特点：

一个好的hash函数应（近似地）满足简单一致散列的假设，即每个关键字都等可能地散列到m个槽位的任何一个中去，并与其他的关键字已被散列到哪个个槽为无关。
一个好的hash函数应能最小化将这些相近的符号散列到同一个槽中的可能性，比如pt和pts的散列值要经可能的不一致，而不要相同。

(1.1) 直接寻址法

(1.2) 除法散列法

(1.3) 乘法散列法

(1.4) 全域散列法

(2) hash函数冲突处理

(2.1) 开放寻址法

线性探查
二次探查
双重散列

(2.2) 链表法

(2.3) 再hash法

(2.4) 建立一个公共的溢出区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
海量数据处理技术(1): 散列技术

Hash,音译“哈希”，也称为散列表。它是将任意的输入通过映射函数映射到一个指定的输出空间。该映射函数函数称为hash函数，指定的输出空间称为hash表。通常是将一个大的数据集映射到一个小的数据集上
复制链接

扫一扫

专栏目录

博客等级

码龄11年

16
原创

5
点赞

12
收藏

8
粉丝

关注

私信

热门文章

分类专栏

Cocos2dx 1篇
C++ 6篇
Computer Graphic 1篇
Game Engine 1篇
Algorithm 1篇
OpenCV 1篇
海量数据 2篇
数据分析 4篇

最新评论

False Positive 和 False Negative
zh_harry 回复 m0_37770137: 真是错的
False Positive 和 False Negative
技术菌的blog: 检测结果, 观察结果, 真实结果,预测结果..好乱。。
基于MinGW的QT环境配置OpenCV
qq_36004230 回复邓无邪: 解决了吗？
False Positive 和 False Negative
m0_37770137: 这篇文章是错误的，怎么还挂在这这么久
基于MinGW的QT环境配置OpenCV
邓无邪: 按照你所有的步骤配置了，但是最后运行程序出现下面这样的错误： undefined reference to cv::_InputArray::_InputArray(cv::Mat const&) undefined reference to cv::fastFree(void*) undefined reference to cv::Mat::deallocate() 不知道您知道怎么回事不？试了很多次，都是这样的错误，找不到一个解决办法啊，很是难过！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。