考虑到安全指数是一个较大范围内的整数、小菜很可能搞不清楚自己是否真的安全,顿顿决定设置一个阈值 θθ,以便将安全指数 yy 转化为一个具体的预测结果——“会挂科”或“不会挂科”。
因为安全指数越高表明小菜同学挂科的可能性越低,所以当 y≥θy≥θ 时,顿顿会预测小菜这学期很安全、不会挂科;反之若 y<θy<θ ,顿顿就会劝诫小菜:“你期末要挂科了,勿谓言之不预也。”
那么这个阈值该如何设定呢?
顿顿准备从过往中寻找答案。
具体来说,顿顿评估了 mm 位同学上学期的安全指数,其中第 ii(1≤i≤m1≤i≤m)位同学的安全指数为 yiyi,是一个 [0,108][0,108] 范围内的整数;同时,该同学上学期的挂科情况记作 resulti∈{0,1}resulti∈{0,1},其中 00 表示挂科、11 表示未挂科。
相应地,顿顿用 predictθ(y)predictθ(y) 表示根据阈值 θθ 将安全指数 yy 转化为的具体预测结果。
如果 predictθ(yj)predictθ(yj) 与 resultjresultj 相同,则说明阈值为 θθ 时顿顿对第 jj 位同学是否挂科预测正确;不同则说明预测错误。
predictθ(y)={0 (y<θ)1 (y≥θ)predictθ(y)={0 (y<θ)1 (y≥θ)
最后,顿顿设计了如下公式来计算最佳阈值 θ∗θ∗:
θ∗=maxargmaxθ∈yi∑j=1m(predictθ(yj)==resultj)θ∗=maxargmaxθ∈yi∑j=1m(predictθ(yj)==resultj)
该公式亦可等价地表述为如下规则:
- 最佳阈值仅在 yiyi 中选取,即与某位同学的安全指数相同;
- 按照该阈值对这 mm 位同学上学期的挂科情况进行预测,预测正确的次数最多(即准确率最高);
- 多个阈值均可以达到最高准确率时,选取其中最大的。
输入格式
输入的第一行包含一个正整数 mm。
接下来输入 mm 行,其中第 ii(1≤i≤m1≤i≤m)行包括用空格分隔的两个整数 yiyi 和 resultiresulti,含义如上文所述。
输出格式
输出一个整数,表示最佳阈值 θ∗θ∗。
数据范围
70%70% 的测试数据保证 m≤200m≤200;
全部的测试数据保证 2≤m≤1052≤m≤105。
输入样例1:
6
0 0
1 0
1 1
3 1
5 1
7 1
输出样例1:
3
样例1解释
按照规则一,最佳阈值的选取范围为 {0,1,3,5,7}{0,1,3,5,7}。
θ=0θ=0 时,预测正确次数为 44;
θ=1θ=1 时,预测正确次数为 55;
θ=3θ=3 时,预测正确次数为 55;
θ=5θ=5 时,预测正确次数为 44;
θ=7θ=7 时,预测正确次数为 33。
阈值选取为 11 或 33 时,预测准确率最高;所以按照规则二,最佳阈值的选取范围缩小为 {1,3}{1,3}。
依规则三,θ∗=max{1,3}=3θ∗=max{1,3}=3。
输入样例2:
8
5 1
5 0
5 0
2 1
3 0
4 0
100000000 1
1 0
输出样例2:
100000000
代码如下:
#include <bits/stdc++.h>
using namespace std;
struct node
{
int x;//安全指数
int y;//挂科情况
int num0;//该结点前面0的数量
};
bool cmp(node a,node b)//sort函数重新定义
{
return a.x<b.x;
}
int main()
{
int n;
scanf("%d",&n);
node a[n];
int maxx=0,no=0,count0=0;
for(int i=0;i<n;i++)
{
scanf("%d%d",&a[i].x,&a[i].y);
a[i].num0=0;
if(a[i].y==0)
{
count0++;//把所有
}
}
sort(a,a+n,cmp);//从大到小排序
int ccount0=0;
for(int i=0;i<n;i++)
{
a[i].num0=ccount0;
if(i==0||(i!=0&&a[i].x!=a[i-1].x))
{
int m=2*a[i].num0+n-i-count0;//算出预测正确指数
if(maxx<m)
{
maxx=m;
no=a[i].x;
}
else if(maxx==m)//如果预测正确指数一样,no取大的
{
if(a[i].x>no)
no=a[i].x;
}
}
if(a[i].y==0)
ccount0++;
}
printf("%d",no);
return 0;
}