CCF 2020-12-2 期末预测之最佳阈值,个人总结,适合新手,思路简单

CCF 2020-12-2 期末预测之最佳阈值,个人总结,适合新手,思路简单

题目概述

我就直接上图了在这里插入图片描述
CCF前两题嘛,DDDD,看完题目要求直接淦!暴力就vans了,正常人都因为O(n*n)超时有70分,好家伙我直接写错了只有50,(👎 我淦
题目中最后说了,30%的数据会超过200,也就是30%的数据必让O(n*n)玩家超时,(那比200大了不知道多少咯)
然后博主也跑去看网上大佬题解,看了仨,好家伙没有一个看明白的(👎 我淦
然后自己对着题目想了想,别说,还真过了。
感觉自己思路不难理解,所以运行时间也较短,于是就想分享一下,(望大佬指正

思路

  • 结构体 node,v保存阈值,flag保存它是否挂科的实际情况
struct node
{
    int v;
    int flag;
};
  • 排序规则,按照 node.v 来排,若node.v 相等则按照node.flag 来排序
bool cmp(node s1, node s2)
{ //排序规则
    if (s1.v != s2.v)
    {
        return s1.v < s2.v;
    }
    //这里是 s的value相等的时候
    return s1.flag < s2.flag;
}
  • 然后注意看题目中这个函数
    在这里插入图片描述
    它说明了在某个阈值θ下,它本身这个 node ,预测值是为1的,也就是自己的 flag 为1,自己才能为自己阈值的可信度贡献一份力量(+1s
  • 我们把θ*(如上面的第二个公式所示),称作阈值θ的可信度
  • 众所周知,我们需要对输入数据进行排序,以达到把O(n*n)变为O(n*logn)来降低时间复杂度,这个nlogn就是sort()
sort(a, a + m, cmp);
  • 设置一个变量zeros作为当前阈值下,flag为0的可以信任的节点
    也就是说,在阈值θ下,有多少个flag为0的节点 贡献了可信度,在排序后,就是所有 node.v 比θ小 而且! flag=0的节点

  • 设置一个变量ones作为当前阈值下,flag为1的可以信任的节点
    也就是说,在阈值θ下,有多少个flag为1的节点 贡献了可信度,在排序后,就是所有 node.v 比θ大或者等于θ 而且! flag=1的节点

  • 输入时统计flag=1的节点个数作为ones

for (int i = 0; i < m;i++){
        scanf("%d%d",&a[i].v, &a[i].flag);
        if(a[i].flag==1){
            ones++;
        }
    }
排序后第一个节点的可信度为 ones + zeros
max = zeros + ones;
index = a[0].v;
要计算当前node的阈值可信度,只需要知道前一个node的可信度和前一个node的v和flag值,这样形成递推
  • 若当前节点与前一个节点的 node.v 相同,则他们的可信度相同,max值不变,也不需要更新(因为阈值相同)
  • 不管当前 node.v 和前一个节点是否相同,若前一个节点的flag=0,则zero+1,否则ones-1;
  • 当前 node.v 大于前一个节点的时,更新max,更新公式如下
    m a x = o n e s + z e r o s max = ones +zeros max=ones+zeros

说明
因为阈值比我大,或者等于我,而且没挂科的
或者
阈值比我小,挂科了的
才能说明我这个阈值的正确性
每次zeros++ 或者 ones-- 针对的是前一个节点,看看它为后面阈值大一些的节点,做出的贡献

举个例子
拿题目的样例来说明
排序后为

0 0
1 0
1 1
3 1
5 1
7 1

首先,第一个节点,设置 max = ones + zeros
i=1 ,阈值 =1,前一个node flag=0,因此zeros++,然后发现当前v比前一个node大,那么temp_max=ones + zeros = 5 ,temp_max比max大,更新max=5和index=1
i=2 ,阈值 =1,前一个node flag=0,因此zeros++,然后发现当前v和前一个node相同,那么max值不变,不进行其他操作
······以此类推

附录

完整代码
#include <algorithm>
#include <iostream>
using namespace std;

struct node
{
    int v;
    int flag;
};

bool cmp(node s1, node s2)
{ //排序规则
    if (s1.v != s2.v)
    {
        return s1.v < s2.v;
    }
    //这里是 s的value相等的时候
    return s1.flag < s2.flag;
}

int main(){

    node a[100005];
    int zeros = 0;
    int ones = 0;
    //保存可信度最大值,当前阈值可信度,可信度最大的阈值
    int max, temp_max, index;  
    max = 0;
    temp_max = 0;
    index = 0;
    int m;
    scanf("%d", &m);
    for (int i = 0; i < m;i++){
        scanf("%d%d",&a[i].v, &a[i].flag);
        if(a[i].flag==1){
            ones++;
        }
    }
    sort(a, a + m, cmp);
    max = zeros + ones;
    index = a[0].v;
    for (int i = 1; i < m;i++){

        if(a[i-1].flag==0){
            zeros++;
        }
        else if (a[i - 1].flag == 1)
        {
            ones--;
        }

        if(a[i].v>a[i-1].v){
            temp_max = ones + zeros;
            if(temp_max>=max){
                max = temp_max;
                temp_max = 0;
                index = a[i].v;
            }
        }
    }
    printf("%d", index);
    return 0;
}
QA

Q:为什么第一个节点的max值是ones+zeros,也就是ones?
A:排序后,设第一个node的v为 x,y为x之后首个 node.v 大于x的节点
若x 对应的 flag为0,按题目中的意思是不能贡献可信度给x的
x的flag为1的才能贡献可信度
至于比x大的,阈值大于x,没有挂科才能说明你这个可信度正确啊,所以flag=1才能贡献可信度
综上所述,第一个节点的可信度为输入数据 所有 flag=1的节点个数;
在这里插入图片描述
Q、为什么相邻节点可信度 如题解所述变化?
A

  • 阈值相等,可信度相同,不用我多说了吧
  • 阈值不同,就是说明当前节点的v大于前一个,

zeros保存了当前节点之前 0的个数,因为一旦阈值变大了,那么前面所有小阈值,而且flag=0的节点个数,每次检查前一个节点的时候,前一个节点flag=0,在对阈值大一些的节点,它是能贡献可信度的,而flag=1,就不能贡献可信度了,所以需要对zeros–或者ones++

阈值比我大,或者等于我,而且没挂科的
或者
阈值比我小,挂科了的
才能说明我这个阈值的正确性!!!

ones保存了当前节点以及之后1的个数,阈值一旦变大,只有大于等于当前阈值,而且flag=1的节点个数

所以说,zeros是当前阈值下,flag为0的可以信任的节点个数
ones是当前阈值下,flag为1的可以信任的节点个数
总的可信度把二者加起来就可以了

答题结果

在这里插入图片描述

  • 错误那次就不说了哈,(太菜了我
  • 140ms是复制其他博主的题解代码
  • 109ms是按照自己理解做的
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值