实验课7-1开源情报之URL查重简化版-散列表构造

开源情报是指通过公开可用的数据和信息获取情报。随着信息技术的发展,互联网已成为各类情报组织的主要工具之一。在互联网上通过URL访问网站,开源情报系统通过海量的URL搜集信息,这些URL存在大量的重复,通过散列表可以快速的实现,目前实现中常用布隆过滤器的判重方式。
本题中,为了简化编程,假设URL已经通过函数转换成了整数,并且采用简单的散列表实现。设散列表a[18],散列函数是hash(k)=k%17,用开放地址法解决冲突hi​=(h0​+di​)%m。冲突时采用平方探测法,使用增量序列di​=i2。计算输入序列(值>=0)对应的散列地址值。(输入个数不会超过15个)。

提示:本题需要自己写一个构造函数,再写查找函数,三个函数:主函数+create_hash构造函数+find_hash查找函数

输入格式:

第一行为输入个数;
第二行为对应的输入值,用空格隔开。

输出格式:

按输入顺序输出其散列地址。每行对应一个值及其散列地址,中间用空格隔开(即pos前后均有一个空格)

输入样例:

5
141 73 95 112 56

输出样例:

141 pos: 5
73 pos: 6
95 pos: 10
112 pos: 11
56 pos: 9

Ciallo~(∠・ω< )⌒★

思路:

很简单的一个hash表(散列表)构造,只要根据散列表的定义逐步把原始数据塞进指定的数组里,然后用题目给的hash函数计算地址值就行。

(当然如果你不知道散列表的概念那当我没讲,大致上可以简单理解为用固定算法来计算数据,得到地址的值,再分配该地址给数据)

然后我们看到是用开放地址法解决冲突问题,冲突是什么意思就不再过多赘述,到现在为止,我们已经得到了构造散列表全部的要素,接下来就是代码time:

代码:

#include<stdio.h>
#define N 18
int main()
{
    int n;int a[N];int x,k,h,H;
    int i=0;int j=0;
    scanf("%d",&n);
    for(i=0;i<N;i++)
        a[i]=-1;//初始化散列表
    for(i=0;i<n;i++)
    {
        k=0;
        scanf("%d",&x);
        h=x%17;//h0的计算,根据题目要求来求值
        if(a[h]==-1)//判断是否冲突,我们提前初始化数组为-1,所以如果该地址的值为-1,就不冲突
        {
            a[h]=x;
            k=h;
        }
        else//这里是冲突的情况
        {
            for(j=1;j<N;j++)
            {
                H=(h+(j*j))%18;
                if(a[H]==-1)//不冲突了,找到了一个没被分配过的地址
                {
                    a[H]=x;
                    k=H;
                    break;
                }
            }
        }
        printf("%d pos: %d\n",x,k);
    }
}

题目要求的是三个函数,因为确实过于简单我就犯了懒,没写那么多,想借鉴学习的小土豆们倒是可以自己开动脑筋写三个函数出来。

でわ、終わります。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值