一种静态hash的实现

最新推荐文章于 2022-11-02 10:07:22 发布

zhanglehes

最新推荐文章于 2022-11-02 10:07:22 发布

阅读量676

点赞数

分类专栏：数据结构文章标签： c++ 数据结构 hash

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhanglehes/article/details/38064907

版权

数据结构专栏收录该内容

2 篇文章 0 订阅

订阅专栏

先看核心接口

template <class Kty,class Vty>

class static_hash_map

{

bool load_serialized_hash_file(const char* file, const Vty&invalid_val);

Vty operator[](const Kty& k);

template<class C>

boolcontainer_to_hash_file(C& dynamic_container, unsigned int bucket_pow, constchar* file);

}

load_serialized_hash_file是有文件快速生成static_hash_map对象

operator是快速查询的api

container_to_hash_file是把任意容器，通过迭代器遍历生成静态hash文件

它在文件中的组织结构如下图所示：

Header块 -> Bucket块 -> Hasher块 -> Value块

Header中记录了bucket的个数和element的个数

Bucket中记录的是每个key在进行hash_wrapper计算后在hasher和value两个模块的offset，每个单元式Int类型

Hasher中的值通过hash_wrapper计算得出的。这个结构并没有原始key的保存，而是通过hasher来定位，这样就需要保证每个key一定对应唯一的一个hasher值。该类型为u64，对于数字类型直接取其值就行，对于struct类型，要求该struct的字节数不能超过64位。对于string类型，有一个计算公式，但如何保证唯一的暂时还没有搞懂。

Value结构中存储的就是原始的value值

这种结构的速度快是来源于以下的设计

1． Bucket number必然是2的整数幂，这样offset可以以如下方式快速得到

#define num_to_bucket_id(num, buck_num) ((num) &((buck_num) - 1))

2．所有的key通过hash_wrapper转换为唯一的u64，在进行比较时非常的快（相比于字符串）

3．没有链表的next指针，所有在相同bucket的key-value一定是顺序存放的，这样空间也得到节省（在加载过程中会有临时变量，该临时变量会有next指针）

4．只有有限个系统函数的调用（毕竟个数事先是知道的）

这样的static_hash_map不能支持Insert等动态操作，但对于仅在程序启动时才可能更新数据的地方非常的高效。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一种静态hash的实现

先看核心接口template class static_hash_map{ bool load_serialized_hash_file(const char* file, const Vty&invalid_val); Vty operator[](const Kty& k); templateboolcontainer_to_hash_fil
复制链接

扫一扫

专栏目录

zhanglehes CSDN认证博客专家 CSDN认证企业博客

码龄14年

155: 原创

6万+: 周排名

1万+: 总排名

18万+: 访问

: 等级

2312: 积分

104: 粉丝

161: 获赞

18: 评论

319: 收藏

私信

关注

热门文章

分类专栏

线上问题分析 11篇
git 2篇
数学 9篇
源码分析 18篇
操作系统 18篇
路径规划 7篇
技术心得 3篇
golang深入 18篇
通信协议 1篇
golang标准库 3篇
golang读书笔记 8篇
golang
golang常用库 1篇
leecode 5篇
lua 2篇
c++ 33篇
数据结构 2篇
python 5篇
算法 9篇
linux 7篇
架构 30篇
网络编程 3篇
zookeeper 4篇

最新评论

隐马尔可夫模型在map-matching中的应用
苏颜蒙: 转移概率矩阵不对了吧，横向概率和应该是1才对
Golang Http RoundTrip解析
Chenal两个维度: 引用「numExpectedResponses」 1、numExpectedResponses 从上下文看这个字段的功能应该是发出请求后期望得到应答的次数。 2、在readLoop中，如果是初次请求numExpectedResponses ==0的判断正常来说会立刻进入，导致pconn关闭（net.conn伴随关闭），这个成员之后在后续的调用次序中的(pc *persistConn) roundTrip函数中才会++，所以必然有其它措施防止进入该判断>>关注到该判断之前有peek()调用数据，因为还未发起请求所以peek调用内会触发bufio的fill，这个方法会连续尝试100次数据读取，触发的是(pc *persistConn) Read>>net.conn.read，tcp传输层的read一般都是堵塞的，所以100次等待足够到(pc *persistConn) roundTrip执行，所以避免了关闭（除非极度异常的情况下） >>>numExpectedResponses==0的含义可能不是sever端断开链接，而是等待足够久后还未接收到应答数据。
kafka-go源码解析三（Reader）
sunshine tome: 如果是多个分区就需要开启多个reader吗
C++ json-cpp库的基本使用方法
蛋超饭不要加蛋: 支持博主，已三连
C++编译时遇到protobuf版本不一致的问题
zhanglehes: 那可能是你新加入的项目的protoc版本和项目已有的版本不兼容

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。