Bloom Filter 主流Hash散列算法介绍

     在云计算中的数据存储方面,散列对提高查询效率起着很大的作用,散列函数是将字符串或者数字作为输入,通过计算输出一个整数,理想的散列函数输出非常均匀分布在可能的输出域,特别是当输入非常相似的时候。不同于加密散列函数,这些函数不是为防止攻击者找出碰撞而设计的。加密散列函数有这个特性但是要慢的多: SHA-1大约为0.09 bytes/cycle,而最新的非加密散列函数的速度大约为3 bytes/cycle。

     所以在不考虑抵御攻击的成本下,非加密散列大约要快33倍,非加密散列函数用的最多的地方是hash table。网络上提到散列的算法很多,资料纷杂,本文仅仅对各位博主的博文进行整合,旨在给大家一个清晰的关于散列函数的简要介绍。散列函数经历了多次改进,本文将改进分为三个阶段,并且给出了各个阶段的标志性算法的介绍和具体方法:

第一代:Bob Jenkins' Functions

     Bob Jenkins在1997年他在《 Dr. Dobbs Journal》杂志上发表了一片关于散列函数的文章《A hash function for hash Table lookup》,这篇文章自从发表以后现在网上有更多的扩展内容。这篇文章中,Bob广泛收录了很多已有的散列函数,这其中也包括了他自己所谓的“lookup2”。随后在2006年,Bob发布了lookup3,由于它即快速(Bob自称,0.5 bytes/cycle)又无严重缺陷,在这篇文章中我把它认为是第一个“现代”散列函数。这里列出他的第一个版本的代码,其主要思想如下:

    uint32_tjenkins_one_at_a_time_hash(unsigned char *key, size_t key_len){
        uint32_t hash = 0;
        size_t i;

        for (i = 0; i < key_len; i++) {
            hash += key
;
            hash += (hash << 10);
            hash ^= (hash >> 6);
        }
        hash += (hash << 3);
        hash ^= (hash >> 11);
        ha

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值