试题编号: | 202012-2 |
试题名称: | 期末预测之最佳阈值 |
时间限制: | 1.0s |
内存限制: | 512.0MB |
问题描述: | 题目背景考虑到安全指数是一个较大范围内的整数、小菜很可能搞不清楚自己是否真的安全,顿顿决定设置一个阈值 θ,以便将安全指数 y 转化为一个具体的预测结果——“会挂科”或“不会挂科”。 因为安全指数越高表明小菜同学挂科的可能性越低,所以当 y≥θ 时,顿顿会预测小菜这学期很安全、不会挂科;反之若 y<θ,顿顿就会劝诫小菜:“你期末要挂科了,勿谓言之不预也。” 那么这个阈值该如何设定呢?顿顿准备从过往中寻找答案。 题目描述具体来说,顿顿评估了 m 位同学上学期的安全指数,其中第 i(1≤i≤m)位同学的安全指数为 yi,是一个 [0,108] 范围内的整数;同时,该同学上学期的挂科情况记作 resulti∈0,1,其中 0 表示挂科、1 表示未挂科。 相应地,顿顿用 predictθ(y) 表示根据阈值 θ 将安全指数 y 转化为的具体预测结果。 predictθ(y)={0(y<θ)1(y≥θ) 最后,顿顿设计了如下公式来计算最佳阈值 θ∗: θ∗=maxargmaxθ∈yi∑j=1m(predictθ(yj)==resultj) 该公式亦可等价地表述为如下规则:
输入格式从标准输入读入数据。 输入的第一行包含一个正整数 m。 接下来输入 m 行,其中第 i(1≤i≤m)行包括用空格分隔的两个整数 yi 和 resulti,含义如上文所述。 输出格式输出到标准输出。 输出一个整数,表示最佳阈值 θ∗。 样例1输入 Data 样例1输出 Data 样例1解释按照规则一,最佳阈值的选取范围为 0,1,3,5,7。 θ=0 时,预测正确次数为 4; θ=1 时,预测正确次数为 5; θ=3 时,预测正确次数为 5; θ=5 时,预测正确次数为 4; θ=7 时,预测正确次数为 3。 阈值选取为 1 或 3 时,预测准确率最高; 依规则三,θ∗=max1,3=3。 样例2输入 Data 样例2输出 Data 子任务70% 的测试数据保证 m≤200; 全部的测试数据保证 2≤m≤105。 |
#include<iostream>
#include<algorithm>
using namespace std;
typedef struct Node{
int theta;
int result;
}Node;
bool cmp(Node a,Node b){
return a.theta<b.theta;
}
int main(){
int m;
Node node[100005];
int flag0[100005]={0}; //记录小于每个位置点阈值的result=0的个数
int flag1[100005]={0}; //记录大于等于每个位置点阈值的result=1的个数
/*--输入--*/
cin>>m;
for(int i=0;i<m;i++){
cin>>node[i].theta>>node[i].result;
}
sort(node,node+m,cmp); //输入后排序
int i=0,j=1;
int temp0=0,temp1=0;
/*--统计小于每个阈值的result=0的个数--*/
while(j<m){
if(node[j].theta==node[i].theta){
j++;
continue;
}
int temp=0;
while(i<j){
if(node[i].result==0)temp++;
flag0[i]=temp0;
i++;
}
temp0+=temp;
}
while(i<j){
flag0[i]=temp0;
i++;
}
/*--以上统计小于每个阈值的result=0的个数--*/
/*--以下统计大于等于每个阈值的result=1的个数--*/
for(int i=0;i<m;i++){
if(node[m-1-i].result==1){
temp1++;
}
flag1[m-1-i]=temp1;
}
//根据flag0和flag1计算每个阈值的准确个数,输出最大的对应的阈值
int ans=0,num=0;
for(int i=0;i<m;i++){
if(flag0[i]+flag1[i]>=num){
num=flag0[i]+flag1[i];
ans=node[i].theta;
}
}
cout<<ans;
}
更多相关CCF的试题解答,请点击>>CCF历年认证考试解答