实验课7-2开源情报之URL查重简化版-散列表查找

开源情报是指通过公开可用的数据和信息获取情报。随着信息技术的发展,互联网已成为各类情报组织的主要工具之一。在互联网上通过URL访问网站,开源情报系统通过海量的URL搜集信息,这些URL存在大量的重复,通过散列表可以快速的实现,目前实现中常用布隆过滤器的判重方式。本题中,为了简化编程,假设URL已经通过函数转换成了整数,并且采用简单的散列表实现。设散列表a[18],散列函数是hash(k)=k%17,用开放地址法解决冲突hi​=(h0​+di​)%m。冲突时采用随机探测法,使用增量序列di+1​=(5*di​+11)%16,其中d0​=h0​。计算输入序列(值>=0)对应的散列地址并进行查找,如果有此元素,则输出散列地址,如果无此元素,则输出not found。并输出查找次数(输入个数不会超过15个)

输入格式:

第一行为输入个数;
第二行为对应的输入值,用空格隔开;
第三行为需查找的元素个数;

第四行为需查找的元素。

输出格式:

第一行依次输出输入序列的散列地址,以一个空格隔开;
第二行开始输出查找元素的散列地址,每个元素占一行,每行对应一个值及其散列地址,中间用空格隔开(即pos前后均有一个空格),如果无此元素,则输出not found。

输入样例:

5
48 65 82 90 40
3
82 48 99

输出样例:

14 15 7 5 6 
82 pos:7,try 4
48 pos:14,try 1
99 not found,try 5

 Ciallo~(∠・ω< )⌒★

思路: 

如果哥们你认真的看过上一篇7-1的文章,那么我默认你已经自己查过什么是散列表了嗷,查找很简单,就是把给你的原始数据按照给你的数学公式进行计算然后看数组里是不是存了他想要的数据,简单来说只有三种情况:

第一种:找到了想要的数值,这时候你直接输出他就可以了,pos就是地址值嘛。

第二种:找到了空,数组里没存这个数值呀,那你就输出not found就好了。

第三种:找到了别的数值(不是哥们,你找错人了),这是因为存数据到散列表的时候因为冲突而用这样那样的方法把想存的数据存别的地方去了,你是按照存储的数学公式来找这个散列表,当然会重复一遍这个冲突的过程,所以有时候你会找到其他的值。这种情况下你就需要继续按照解决冲突的数学方法继续进行一次寻找,当然,题目要求我们一并输出查找次数,那么我们就要给查找的循环里面加上一个计数器,每查找一次就加一。

代码:

#include<stdio.h>
#define N 18
int main()
{
    int n;
    int a[N],k[N];
    int x,h,H;
    int d,D;
    int i=0;int j=0;
    int m;
    int l,y;
    int t,T;
    scanf("%d",&n);
    for(i=0;i<N;i++)
        a[i]=-1;
    for(i=0;i<n;i++)//这个循环里是建表过程,先把给你的数据建成散列表
    {
        scanf("%d",&x);
        h=x%17;H=h;d=h;
        if(a[h]==-1)
        {
            a[h]=x;//散列表
            k[i]=h;//存储散列表地址的一个数组,题目要求
        }
        else
        {
            for(j=1;j<N;j++)
            {
                d=(5*d+11)%16;
                H=(h+d)%18;
                if(a[H]==-1)
                {
                    a[H]=x;
                    k[i]=H;
                    break;
                }
            }
        }
    }
    for(i=0;i<n;i++)
        printf("%d ",k[i]);//先输出第一行:散列表地址
    printf("\n");
    scanf("%d",&m);//这里是原始数据的第三行了,开始进行查找操作
    for(i=0;i<m;i++)
    {
        scanf("%d",&y);
        t=y%17;l=0;//t是动态变化的地址值hi,T是题目公式里的h0,D是题目公式里的di,l是查找次数
        T=t;D=t;
        while(1)
        {
            if(a[t]==y)
            {
                l++;
                break;
            }
            else
            {
                if(a[t]==-1)
                {
                    l++;
                    break;
                }
                else
                {
                    D=(5*D+11)%16;
                    t=(T+D)%18;
                    l++;
                }
            }
            if(l>N)
                break;
        }
        if(a[t]==-1)
            printf("%d not found,try %d\n",y,l);
        else
            printf("%d pos:%d,try %d\n",y,t,l);
    }
}

 这次的代码比较混乱,小编实在是懒的把他模块化了,只能说当时的我是个大懒货……

でわ、終わります。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值