题目背景
考虑到安全指数是一个较大范围内的整数、小菜很可能搞不清楚自己是否真的安全,顿顿决定设置一个阈值 θ,以便将安全指数 y 转化为一个具体的预测结果——“会挂科”或“不会挂科”。因为安全指数越高表明小菜同学挂科的可能性越低,所以当 y≥θ 时,顿顿会预测小菜这学期很安全、不会挂科;反之若 y<θ,顿顿就会劝诫小菜:“你期末要挂科了,勿谓言之不预也。”那么这个阈值该如何设定呢?顿顿准备从过往中寻找答案。
题目描述
具体来说,顿顿评估了 m 位同学上学期的安全指数,其中第 i(1≤i≤m)位同学的安全指数为 yi,是一个 [0,108] 范围内的整数;同时,该同学上学期的挂科情况记作 resulti∈0,1,其中 0 表示挂科、1 表示未挂科。相应地,顿顿用 predictθ(y) 表示根据阈值 θ 将安全指数 y 转化为的具体预测结果。如果 predictθ(yj) 与 resultj 相同,则说明阈值为 θ 时顿顿对第 j 位同学是否挂科预测正确;不同则说明预测错误。predictθ(y)={0(y<θ)1(y≥θ)。最后,顿顿设计了如下公式来计算最佳阈值 θ∗ :θ∗=maxargmaxθ∈yi∑j=1m(predictθ(yj)==resultj)
该公式亦可等价地表述为如下规则:
-
最佳阈值仅在 yi 中选取,即与某位同学的安全指数相同;
-
按照该阈值对这 m 位同学上学期的挂科情况进行预测,预测正确的次数最多(即准确率最高);
-
多个阈值均可以达到最高准确率时,选取其中最大的。
输入格式
从标准输入读入数据。
输入的第一行包含一个正整数 m。
接下来输入 m 行,其中第 i(1≤i≤m)行包括用空格分隔的两个整数 yi 和 resulti,含义如上文所述。
输出格式
输出到标准输出。
输出一个整数,表示最佳阈值 θ∗。
样例1输入
6
0 0
1 0
1 1
3 1
5 1
7 1
样例1输出
3
样例1解释
按照规则一,最佳阈值的选取范围为 0,1,3,5,7。
θ=0 时,预测正确次数为 4;
θ=1 时,预测正确次数为 5;
θ=3 时,预测正确次数为 5;
θ=5 时,预测正确次数为 4;
θ=7 时,预测正确次数为 3。
阈值选取为 1 或 3 时,预测准确率最高;
所以按照规则二,最佳阈值的选取范围缩小为 1,3。
依规则三,θ∗= max( 1,3 )= 3 。
样例2输入
8
5 1
5 0
5 0
2 1
3 0
4 0
100000000 1
1 0
样例2输出
100000000
子任务
70% 的测试数据保证 m≤200;
全部的测试数据保证 2≤m≤10^5。
问题分析:
题意是很好理解的,就是将不同的分数定为基准,看哪个分数作为基准时,判断是否及格的准确率最高,如果同样准确率的话,选择分数高的作为基准,因为肯定不能够边处理边输出,所以需要把数据存起来。关键在于m的数量,如果用简单的思路即:把每一个数作为基准遍历肯定是不行,两层for嵌套,肯定会超时,所以需要换思路,一个数作为满足条件的准确率即为,小于它的结果为0的个数,再加上大于等于它的数的结果为1的个数,因此其实题目样例一其实就蕴含隐藏提示,当给的数据是按顺序给出时,比如0,1,3,5,7时,0作为基准时,必然是后面的数(>=0)作为基准时满足为1的数相加前面的数为0(<0)的个数即为4+0,1作为基准时,后面的数(>=1)作为基准时满足为1的数相加前面的数为0(<1)的个数即为4+1,依次推出因此只需要先算出每一数的为0的个数,为1的个数,就可以算出每个数(>=)它自己的为1的个数,和(<=)它自己的为0的个数,最后比较总数就可以了,时间主要耗费在排序上,即O(nlogn)。
#include<iostream>
#include<algorithm>
using namespace std;
int const N = 100000;
typedef struct student {
int y;
int result;//0,1
}student;
typedef struct node {
int y;
int a = 0;//比它大于等于的1
int b = 0;//比它小于等于的0
int sum = 0;
}node;
bool comp(student s1, student s2) {
return s1.y < s2.y;
}
node s1[N];
student s[N];
int main() {
int n;
cin >> n;
for (int i = 0; i < n; i++) {
cin >> s[i].y;
cin >> s[i].result;
}
sort(s, s + n, comp);
int k = 0;
s1[k].y = s[0].y;
if (s[0].result == 1) {
s1[k].a++;
}else {
s1[k].b++;
}
for (int i = 1; i < n; i++) {
if (s1[k].y == s[i].y) {
if (s[i].result == 1) {
s1[k].a++;
}
else {
s1[k].b++;
}
}else {
k++;
s1[k].y = s[i].y;
if (s[i].result == 1) {
s1[k].a++;
}
else {
s1[k].b++;
}
}
}
int sum = 0;
for (int i = 0; i <= k; i++) {
sum += s1[i].b;
s1[i].b = sum;
}
sum = 0;
for (int i = k; i >= 0; i--) {
sum += s1[i].a;
s1[i].a = sum;
}
s1[0].sum = s1->a;
for (int i = 1; i <= k; i++) {
s1[i].sum = s1[i].a + s1[i - 1].b;
}
int max = 0;
int mi = 0;
for (int i = 0; i <= k; i++) {
if (max < s1[i].sum) {
max = s1[i].sum;
mi = i;
}else if (max == s1[i].sum) {
if (s1[mi].y < s1[i].y) {
mi = i;
}
}
}
cout << s1[mi].y << endl;
}