7-4 开源情报之URL查重简化版-散列表构造
分数 15
中等
全屏浏览
切换布局
作者 袁恩
开源情报是指通过公开可用的数据和信息获取情报。随着信息技术的发展,互联网已成为各类情报组织的主要工具之一。在互联网上通过URL访问网站,开源情报系统通过海量的URL搜集信息,这些URL存在大量的重复,通过散列表可以快速的实现,目前实现中常用布隆过滤器的判重方式。
本题中,为了简化编程,假设URL已经通过函数转换成了整数,并且采用简单的散列表实现。设散列表a[18],散列函数是hash(k)=k%17,用开放地址法解决冲突hi=(h0+di)%m。冲突时采用平方探测法,使用增量序列di=i2。计算输入序列(值>=0)对应的散列地址值。(输入个数不会超过15个)。
输入格式:
第一行为输入个数;
第二行为对应的输入值,用空格隔开。
输出格式:
按输入顺序输出其散列地址。每行对应一个值及其散列地址,中间用空格隔开(即pos前后均有一个空格)
输入样例:
5
141 73 95 112 56
输出样例:
141 pos: 5
73 pos: 6
95 pos: 10
112 pos: 11
56 pos: 9
以下是本人编写的代码
ps.有查重 请勿照抄 谢谢配合!
#include<stdio.h>
int main()
{
int n,b[15],a[19],i,h0,h,num;
memset(a,0,sizeof(a));
scanf("%d",&n);
for(i=0;i<n;i++)
scanf("%d",&b[i]);
for(i=0;i<n;i++)
{
h0=b[i]%17;
if(a[h0]==0)
{
a[h0]=b[i];
printf("%d pos: %d\n",b[i],h0);
continue;
}
else
{
num=1;
h=h0;
while(a[h]!=0)
{
h=(h0+num*num)%18;
num++;
}
a[h]=b[i];
printf("%d pos: %d\n",b[i],h);
}
}
return 0;
}
只是提供一个思路 请勿照抄 ×3