CLHash：极致速度的哈希函数库-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00506/article/details/141776819

CLHash：极致速度的哈希函数库

clhashC library implementing the ridiculously fast CLHash hashing function项目地址:https://gitcode.com/gh_mirrors/cl/clhash

项目介绍

CLHash 是一个由C语言编写的超高速哈希函数库，并附带C++封装。它利用了无进位乘法（carry-less multiplication）和SSE指令集，专为最近的x64处理器设计（推荐Haswell架构或更新）。在如Skylake这样的现代Intel处理器上，CLHash能够实现接近0.1周期每字节的哈希速度，但适用于较大字符串，即长度显著超过128位向量寄存器大小。此库不旨在成为通用的哈希函数，但在适合的应用场景中能提供惊人的性能。

项目快速启动

要迅速开始使用CLHash，确保你的开发环境支持C99标准。以下步骤将引导你完成基本的集成过程：

克隆仓库:

git clone https://github.com/lemire/clhash.git

构建并运行单元测试（可选，但推荐验证安装正确性）:
```
cd clhash
make unit
```

简单应用示例: 在你的项目中，引入必要的头文件，并使用以下代码进行哈希计算。

#include <assert.h>
#include "clhash.h"

int main() {
    void* random = get_random_key_for_clhash(UINT64_C(0x23a23cf5033c3c81), UINT64_C(0xb3816f6a2c68e530));
    uint64_t hashvalue1 = clhash(random, "my dog", 6);
    uint64_t hashvalue2 = clhash(random, "my cat", 6);
    uint64_t hashvalue3 = clhash(random, "my dog", 6);
    assert(hashvalue1 == hashvalue3);
    assert(hashvalue1 != hashvalue2); // 应该不同，除非随机密钥相同且输入差异不足以引起足够的散列变化
    free(random);
    return 0;
}

对于C++用户，CLHash提供了更加方便的接口来处理std::vector和std::string。