7-69 集合相似度 (25 分)
给定两个整数集合,它们的相似度定义为:Nc/Nt×100%。其中Nc是两个集合都有的不相等整数的个数,Nt是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。
输入格式:
输入第一行给出一个正整数N(≤50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(≤104),是集合中元素的个数;然后跟M个[0,109]区间内的整数。
之后一行给出一个正整数K(≤2000),随后K行,每行对应一对需要计算相似度的集合的编号(集合从1到N编号)。数字间以空格分隔。
输出格式:
对每一对需要计算的集合,在一行中输出它们的相似度,为保留小数点后2位的百分比数字。
输入样例:
3 3 99 87 101 4 87 101 5 87 7 99 101 18 5 135 18 99 2 1 2 1 3
结尾无空行
输出样例:
50.00% 33.33%
结尾无空行
本人使用了结构数组存储每个集合的数量M和集合数据group[]
可以通过测试点0和3
尚未查明段错误、运行时错误的数组越界出在哪里
欢迎讨论指正
#include<stdio.h>
#include<stdlib.h>
#define MAXN 51
#define MAXM 10001
typedef struct set_element{
int M;
long group[MAXM];
}group;
double Set_similarity(group *p , group *q);//传人两个数组并求集合相似度
void De_duplication(group *p);//将数组元素去重
int main(){
group List[MAXN];
int N , i , j , K;
scanf("%d", &N); //共有N个集合
for(i = 0;i < N;i ++){
scanf("%d",&List[i].M);
for(j = 0;j < List[i].M;j ++){
scanf("%ld",&List[i].group[j]);//将每个数组填充(空间严重浪费 但没有办法@_@)
}
}
scanf("%d",&K);
for(i = 0;i < K;i ++){
int j , k;
double similarity_rate;
scanf("%d %d",&j ,&k);
similarity_rate = Set_similarity(&List[j - 1] , &List[k - 1]);
printf("%.2lf%%",similarity_rate);
if(i != K - 1){
printf("\n");
}
}
return 0;
}
void De_duplication(group *p){//去重
int i , k = 0 , j = 0;//循环控制变量
//我需要一个记录出现数的数组
//需要一个下标是出现数的数组
//让我们开始吧^_^
long num[2001] = {0}; //每个数组最多2000个数
int record[1000] = {0};//先假定他不会超过吧#_#
while(k <= p->M){ //使用while去重
num[j] = p->group[k];
if(record[num[j]] == 0){
record[num[j]] = 1;
k ++;
}else{
for(i = k;i < p->M;i ++){
p->group[i] = p->group[i + 1];
}
p->M --;
}
j ++;
}
}
double Set_similarity(group *p ,group *q){//将两个集合传进去
double res;
int i , j ,count = 0;
//首先去重
De_duplication(p);
De_duplication(q);
for(i = 0;i < p->M;i ++){
for(j = 0;j < q->M;j ++){
if(p->group[i] == q->group[j]){
count ++;
}
}
}
res = (count * 1.0) / ((p->M + q->M + - count)*(1.0)) * 100;
return res;
}