【转】Hash表原理 & C实现的Hash表

      一列键值对数据,存储在一个table中,如何通过数据的关键字快速查找相应值呢?不要告诉我一个个拿出来比较key啊,呵呵。 大家都知道,在所有的线性数据结构中,数组的定位速度最快,因为它可通过数组下标直接定位到相应的数组空间,就不需要一个个查找。而哈希表就是利用数组这个能够快速定位数据的结构解决以上的问题的。 


具体如何做呢?大家是否有注意到前面说的话:“数组可以通过下标直接定位到相应的空间”,对就是这句,哈希表的做法其实很简单,就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里,而当使用哈希表进行查询的时候,就是再次使用哈希函数将key转换为对应的数组下标,并定位到该空间获取value,如此一来,就可以充分利用到数组的定位性能进行数据定位。

不知道说到这里,一些不了解的朋友是否大概了解了哈希表的原理,其实就是通过空间换取时间的做法。到这里,可能有的朋友就会问,哈希函数对key进行转换,取余的值一定是唯一的吗?这个当然不能保证,主要是由于hashcode会对数组长度进行取余,因此其结果由于数组长度的限制必然会出现重复,所以就会有“冲突”这一问题,至于解决冲突的办法其实有很多种,比如重复散列的方式,大概就是定位的空间已经存在value且key不同的话就重新进行哈希加一并求模数组元素个数,既 (h(k)+i) mod S , i=1,2,3…… ,直到找到空间为止。还有其他的方式大家如果有兴趣的话可以自己找找资料看看。 

Hash表这种数据结构在java中是原生的一个集合对象,在实际中用途极广,主要有这么几个特点:

1.访问速度快

2.大小不受限制

3.按键进行索引,没有重复对象

4.用字符串(id:string)检索对象(object)

今天整理以前在学校写的一些算法,翻出来一个hash表的实现,就贴出来,自己也温习温习。
先看看头文件,也就是数据结构的定义,相当于java中的接口的概念:

#include  < stdio.h >

#define     HASHSIZE 256

//定义hash表中的节点的类型
struct     nlist{
     struct     nlist     * next;
     char      * name;
     char      * defn;
};

//定义接口中的函数,也就是对外来说,这个程序可以做什么
unsigned    hash( char  * s);//计算一个串的hash值
struct     nlist     * lookup( char  * s);//查找一个value,根据key
struct     nlist     * install( char  * name, char  * defn);//插入一个key=value的对象


然后是具体实现:

#include  < string .h >
#include  " list.h "

static  struct  nlist  * hashtab[HASHSIZE];

unsigned    hash( char  * s)//取得hash值
{
    unsigned    hashval;

     for (hashval  =  0 ;  * s  !=  ' \0 ' ;s ++ )
            hashval  =  * s  +  31  *  hashval;
     return  hashval  %  HASHSIZE;
}

struct     nlist     * lookup( char  * s)
{
     struct     nlist     * np;

     for (np  =  hashtab[hash(s)]; np  !=  NULL; np  =  np -> next)
         if (strcmp(s,np -> name)  ==  0 )
             return  np;
     return  NULL;
}

struct     nlist     * install( char  * name, char  * defn)
{
     struct     nlist     * np;
    unsigned    hashval;

     if ((np  =  lookup(name))  ==  NULL){
        np  =  ( struct  nlist  * )malloc( sizeof ( struct  nlist));
         if (np  ==  NULL  ||  (np -> name  =  strdup(name))  ==  NULL)
                 return  NULL;
        hashval  =  hash(name);
        np -> next =  hashtab[hashval];
        hashtab[hashval]  =  np;
    } else
        free(( void  * )np -> defn);
     if ((np -> defn  =  strdup(defn))  ==  NULL)
             return  NULL;
     return  np;
}

很简单,只有两个外部接口,

  1. install(key, value),用来插入一个新的节点
  2. lookup(key),根据一个键来进行搜索,并返回节点

代码很简单,主要用到的hash算法跟java中的String的hashcode()方法中用到的算法一样,使用:

 

unsigned    hash( char  * s)
{
    unsigned    hashval;

     for (hashval  =  0 ;  * s  !=  ' \0 ' ;s ++ )
            hashval  =  * s  +  31  *  hashval;
     return  hashval  %  HASHSIZE;
}

 

这里的31并非随意,乃是一个经验值,选取它的目的在于减少冲突,当然,hash冲突这个问题是不能根本避免的。这里只是一个人们在测试中发现的可以相对减少hash冲突的一个数字,可能以后会发现更好的数值来。

转载于:https://www.cnblogs.com/maojianhui/articles/2529842.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
哈希过滤器是一种常见的数据结构,它用于判断一个元素是否在一个集合中。它的主要原理是将元素映射到一个哈希中的一个位置,如果该位置上已经有元素了,就说明该元素可能在集合中,否则该元素一定不在集合中。 具体来说,哈希过滤器包括两个主要部分:哈希函数和位图。 哈希函数将元素映射到哈希中的一个位置,通常使用的是一些比较简单的函数,例如取模函数、乘法哈希函数、MurmurHash 等。 位图是一个二进制向量,它的每个元素都只能是0或1。哈希函数返回的值被用作位图中的下标,对应的位置上的值被设置为1,示该元素存在于集合中。当判断一个元素是否在集合中时,只需要将它经过哈希函数得到的位置在位图中查找,如果该位置的值为1,则该元素可能在集合中,否则一定不在集合中。 以下是一个简单的基于 C 语言的哈希过滤器的实现示例: ```c #include <stdlib.h> #include <stdint.h> #include <stdbool.h> #define FILTER_SIZE 1000 typedef struct { uint8_t *bits; size_t size; } filter_t; filter_t *filter_create(size_t size) { filter_t *filter = (filter_t *)malloc(sizeof(filter_t)); filter->bits = (uint8_t *)calloc(size, sizeof(uint8_t)); filter->size = size; return filter; } void filter_add(filter_t *filter, const void *key, size_t len) { size_t index = *((size_t *)key) % filter->size; filter->bits[index] = 1; } bool filter_contains(filter_t *filter, const void *key, size_t len) { size_t index = *((size_t *)key) % filter->size; return filter->bits[index] == 1; } void filter_destroy(filter_t *filter) { free(filter->bits); free(filter); } ``` 该实现中,`filter_t` 结构体包含一个 `bits` 数组和 `size` 属性,其中 `bits` 数组用于存储位图,`size` 属性示位图的大小。 `filter_create` 函数用于创建一个新的哈希过滤器,它接受一个参数 `size`,示位图的大小。 `filter_add` 函数用于将一个元素添加到哈希过滤器中,它接受两个参数,`key` 和 `len`,分别示要添加的元素和元素的长度。在该函数中,元素经过哈希函数得到一个下标 `index`,该下标对应的位置在位图中被设置为1,示该元素存在于集合中。 `filter_contains` 函数用于判断一个元素是否在哈希过滤器中,它接
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值