CCF 2020-12-2 期末预测之最佳阈值

最新推荐文章于 2021-12-04 23:35:10 发布

夏末秋也凉

最新推荐文章于 2021-12-04 23:35:10 发布

阅读量1.8k

点赞数 5

分类专栏： ccf 文章标签： ccf c++

本文链接：https://blog.csdn.net/qq_45964225/article/details/112555998

版权

ccf 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

题目背景

考虑到安全指数是一个较大范围内的整数、小菜很可能搞不清楚自己是否真的安全，顿顿决定设置一个阈值 θ，以便将安全指数 y 转化为一个具体的预测结果——“会挂科”或“不会挂科”。因为安全指数越高表明小菜同学挂科的可能性越低，所以当 y≥θ 时，顿顿会预测小菜这学期很安全、不会挂科；反之若 y<θ，顿顿就会劝诫小菜：“你期末要挂科了，勿谓言之不预也。”那么这个阈值该如何设定呢？顿顿准备从过往中寻找答案。

题目描述

具体来说，顿顿评估了 m 位同学上学期的安全指数，其中第 i（1≤i≤m）位同学的安全指数为 yi，是一个 [0,108] 范围内的整数；同时，该同学上学期的挂科情况记作 resulti∈0,1，其中 0 表示挂科、1 表示未挂科。相应地，顿顿用 predictθ(y) 表示根据阈值 θ 将安全指数 y 转化为的具体预测结果。如果 predictθ(yj) 与 resultj 相同，则说明阈值为 θ 时顿顿对第 j 位同学是否挂科预测正确；不同则说明预测错误。predictθ(y)={0(y<θ)1(y≥θ)。最后，顿顿设计了如下公式来计算最佳阈值 θ∗ ：θ∗=maxargmaxθ∈yi⁡∑j=1m(predictθ(yj)==resultj)

该公式亦可等价地表述为如下规则：

最佳阈值仅在 yi 中选取，即与某位同学的安全指数相同；
按照该阈值对这 m 位同学上学期的挂科情况进行预测，预测正确的次数最多（即准确率最高）；
多个阈值均可以达到最高准确率时，选取其中最大的。

输入格式

从标准输入读入数据。

输入的第一行包含一个正整数 m。

接下来输入 m 行，其中第 i（1≤i≤m）行包括用空格分隔的两个整数 yi 和 resulti，含义如上文所述。

输出格式

输出到标准输出。

输出一个整数，表示最佳阈值 θ∗。

样例1输入

样例1输出

样例1解释

按照规则一，最佳阈值的选取范围为 0,1,3,5,7。

θ=0 时，预测正确次数为 4；

θ=1 时，预测正确次数为 5；

θ=3 时，预测正确次数为 5；

θ=5 时，预测正确次数为 4；

θ=7 时，预测正确次数为 3。

阈值选取为 1 或 3 时，预测准确率最高；

所以按照规则二，最佳阈值的选取范围缩小为 1,3。

依规则三，θ∗= max（ 1,3 ）= 3 。

样例2输入

8
5 1
5 0
5 0
2 1
3 0
4 0
100000000 1
1 0

样例2输出

100000000

子任务

70% 的测试数据保证 m≤200；

全部的测试数据保证 2≤m≤10^5。

问题分析：

题意是很好理解的，就是将不同的分数定为基准，看哪个分数作为基准时，判断是否及格的准确率最高，如果同样准确率的话，选择分数高的作为基准，因为肯定不能够边处理边输出，所以需要把数据存起来。关键在于m的数量，如果用简单的思路即：把每一个数作为基准遍历肯定是不行，两层for嵌套，肯定会超时，所以需要换思路，一个数作为满足条件的准确率即为，小于它的结果为0的个数，再加上大于等于它的数的结果为1的个数，因此其实题目样例一其实就蕴含隐藏提示，当给的数据是按顺序给出时，比如0，1，3，5，7时，0作为基准时，必然是后面的数（>=0）作为基准时满足为1的数相加前面的数为0（<0）的个数即为4+0，1作为基准时，后面的数（>=1）作为基准时满足为1的数相加前面的数为0（<1）的个数即为4+1，依次推出因此只需要先算出每一数的为0的个数，为1的个数，就可以算出每个数（>=）它自己的为1的个数，和（<=）它自己的为0的个数，最后比较总数就可以了，时间主要耗费在排序上，即O（nlogn）。

#include<iostream>
#include<algorithm>
using namespace std;
int const N = 100000;

typedef struct student {
	int y;
	int result;//0，1
}student;
typedef struct node {
	int y;
	int a = 0;//比它大于等于的1
	int b = 0;//比它小于等于的0
	int sum = 0;
}node;

bool comp(student s1, student s2) {
	return s1.y < s2.y;
}

node s1[N];
student s[N];

int main() {
	int n;
	cin >> n;
	for (int i = 0; i < n; i++) {
		cin >> s[i].y;
		cin >> s[i].result;
	}

	sort(s, s + n, comp);

	int k = 0;
	s1[k].y = s[0].y;
	if (s[0].result == 1) {
		s1[k].a++;
	}else {
		s1[k].b++;
	}
	for (int i = 1; i < n; i++) {
		if (s1[k].y == s[i].y) {
			if (s[i].result == 1) {
				s1[k].a++;
			}
			else {
				s1[k].b++;
			}
		}else {
			k++;
			s1[k].y = s[i].y;
			if (s[i].result == 1) {
				s1[k].a++;
			}
			else {
				s1[k].b++;
			}
		}
	}

	int sum = 0;
	for (int i = 0; i <= k; i++) {		
		sum += s1[i].b;
		s1[i].b = sum;
	}
	sum = 0;
	for (int i = k; i >= 0; i--) {		
		sum += s1[i].a;
		s1[i].a = sum;
	}
	
	s1[0].sum = s1->a;
	for (int i = 1; i <= k; i++) {
		s1[i].sum = s1[i].a + s1[i - 1].b;
	}

	int max = 0;
	int mi = 0;
	for (int i = 0; i <= k; i++) {
		if (max < s1[i].sum) {
			max = s1[i].sum;
			mi = i;
		}else if (max == s1[i].sum) {
			if (s1[mi].y < s1[i].y) {
				mi = i;
			}
		}
	}

	cout << s1[mi].y << endl;
}

夏末秋也凉

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
CCF 2020-12-2 期末预测之最佳阈值

题目背景考虑到安全指数是一个较大范围内的整数、小菜很可能搞不清楚自己是否真的安全，顿顿决定设置一个阈值θ，以便将安全指数y转化为一个具体的预测结果——“会挂科”或“不会挂科”。因为安全指数越高表明小菜同学挂科的可能性越低，所以当y≥θ时，顿顿会预测小菜这学期很安全、不会挂科；反之若y<θ，顿顿就会劝诫小菜：“你期末要挂科了，勿谓言之不预也。”那么这个阈值该如何设定呢？顿顿准备从过往中寻找答案。题目描述具体来说，顿顿评估了m位同学上学期的安全指数，其中第i（1≤i≤m）位同...
复制链接

扫一扫