L2-005. 集合相似度
时间限制
400 ms
内存限制
65536 kB
代码长度限制
8000 B
判题程序
Standard
作者
陈越
给定两个整数集合,它们的相似度定义为:Nc/Nt*100%。其中Nc是两个集合都有的不相等整数的个数,Nt是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。
输入格式:
输入第一行给出一个正整数N(<=50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(<=104),是集合中元素的个数;然后跟M个[0, 109]区间内的整数。
之后一行给出一个正整数K(<=2000),随后K行,每行对应一对需要计算相似度的集合的编号(集合从1到N编号)。数字间以空格分隔。
输出格式:
对每一对需要计算的集合,在一行中输出它们的相似度,为保留小数点后2位的百分比数字。
输入样例:3 3 99 87 101 4 87 101 5 87 7 99 101 18 5 135 18 99 2 1 2 1 3输出样例:
50.00% 33.33%
用sets插入,单集合没有重复的。然后合并集合长度-重复的
用count或者find
find的话:
for(it=u[a].begin();it!=u[a].end();it++){ if(u[b].find(*it)!=u[b].end())same++; }
count在下面
这个容器是利用红黑树平衡二叉树实现,所以检索时间比其他容器要快,时间复杂度也低了。
用Java的API应该也能做。
#include <bits/stdc++.h>
#define INF 0x3fffffff
#define eps 1e-8
typedef long long LL;
const double pi = acos(-1.0);
const int mod = 1e9 + 7;
const int maxn = 1e9+5;
using namespace std;
int main()
{
//freopen("in.txt","r",stdin);
int n, m, a;
set<int> s[50]; //定义一个数组容器
cin>>n; ;
for(int i=0; i<n; i++)
{
scanf("%d", &m);
for(int j=0; j<m; j++)
{
cin >> a;
s[i].insert(a);//Sets特性,后序插入相同的val值无效
}
}
set<int>::iterator it; //想遍历set里的元素,必须定义一个正向迭代器
int num;
cin >> num;
int t1,t2;
while(num--)
{
cin >> t1 >> t2;
t1--;
t2--;//注意题目下标是从1开始的
double sum = 0;
for(it=s[t1].begin(); it!=s[t1].end(); it++ )
{
if(s[t2].count((*it))) //t.count(k),判断元素k是否在容器内只要第二个容器中出现it,就++,求重合数量只用遍历一个容器即可
sum++; //迭代器理解好比指针,注意count传的是地址,*不能喽
}
if(s[t2].count(*(s[t1].end())))
sum++;
printf("%.2lf%%\n", 100.0*sum/(s[t1].size() + s[t2].size() - sum));
}
return 0;
}
最开始的数组遍历思想。。。过了一部分数据,还有一部分数据错误,一部分超时。。。
#include <bits/stdc++.h>
#define INF 0x3fffffff
#define eps 1e-8
typedef long long LL;
const double pi = acos(-1.0);
const int mod = 1e9 + 7;
const int maxn = 1e9+5;
using namespace std;
int a[51][10010];
int len[51];
int main() {
//freopen("in.txt","r",stdin);
int n;
cin>>n;
int m;
for(int i = 0; i < n; i++){
cin>>m;
for(int j = 0; j < m; j++){
cin>>a[i][j];
len[i]++;
}
}
int num;
cin>>num;
for(int i = 0; i < num; i++) {
int t1,t2;
cin>>t1>>t2;
t1--;
t2--;
double sum = 0;
double total = 0;
int tmp1[1][len[t1]];
int tmp2[1][len[t2]];
for(int i = 0; i < len[t1]; i++)
tmp1[0][i] = a[t1][i];
for(int i = 0; i < len[t2]; i++)
tmp2[0][i] = a[t2][i];
sort(tmp1[0],tmp1[0]+len[t1]);
sort(tmp2[0],tmp2[0]+len[t2]);
for(int i = 1; i < len[t1]; i++)
if(tmp1[0][i]==tmp2[0][i-1])
tmp1[0][i-1] = -1;
for(int i = 1; i < len[t2]; i++)
if(tmp2[0][i]==tmp2[0][i-1])
tmp2[0][i-1] = -1;
for(int i = 0; i < len[t1]; i++ ) {
for(int j = 0; j < len[t2]; j++){
if(tmp1[0][i]!=-1&&tmp2[0][j]!=-1)
if(tmp1[0][i]==tmp2[0][j]){
sum++;
tmp1[0][i]=-1;
tmp2[0][j]=-1;
break;
}
}
}
for(int i = 0; i < len[t1]; i++)
if(tmp1[0][i]!=-1)
total++;
for(int j = 0; j < len[t2]; j++)
if(tmp2[0][j]!=-1)
total++;
printf("%.2f",sum*100.0/(sum+total));
puts("%");
}
}