CCF-CSP-202012-2-期末预测之最佳阈值-python100分

最新推荐文章于 2023-11-21 17:56:32 发布

原创

最新推荐文章于 2023-11-21 17:56:32 发布 · 1.5k 阅读

9 ·

CC 4.0 BY-SA版权

本文介绍了两种方法来确定CCF CSP考试预测的最佳阈值。第一种方法是暴力求解，但效率较低，仅能通过部分测试用例。第二种方法利用动态规划优化，统计每个阈值的正确预测数，达到O(n)的时间复杂度，显著提高效率。通过预先计算每个阈值下方0和上方1的数量，避免了重复计算，实现了算法的优化。

方法1：
暴力，把每个阈值和m个条目进行判断，计数。只能过70%的用例

方法2：
统计一个阈值预测准确的数量并不需要一个个判断的嘛，小于该阈值的分数，对应结果要是0（挂）才算正确；大于等于该阈值的分数，对应结果要是1（过）才算正确。所以可先用字典统计每个阈值挂了的（0）和过了的（1）数量，然后按分数大小排序（这一步已经去重复了）。计算阈值正确数的时候，从该阈值开始，往低分处走统计0的数量，往高分处走统计1的数量，最后加一起。

每算一个阈值的正确率，就要往高低走统计，这样复杂度也是O(n^2)，和暴力没区别。不过稍微改一下，就马上变O(n)。往高低走统计数量的时候其实有很多重复了的，比如有阈值[1，3，5，7]，统计7的0的数量时候，往低处算要算上1，3，5的总数，统计5的时候，又要往前统计1，3的，重复很多，我们可以从1开始统计好总数记下来，3的时候用前面1的总数累加3自己的数，到5的时候，用3的累加5的数，就不用往前走了。
我们可以先用数组存好到达每个阈值的0的总数，计算某个阈值的0的总数时只需要用前面的总数加上本身0的数量即可，是一种动态规划。1同理，不过是从高分处开始计算。这样事先把每个阈值的低处0的总数和高处1的总数算出来后，就不用在计算某阈值准确率时往高低两边走，直接从数组中找到结果计算。
我这里直接在字典里加上变量了，没有用数组。

d = {
   
   }
m = int(input())
for i in range(m):
    y, res = map(int, input().split())
    if y in d:
        d[y][res] +=</

最低0.47元/天解锁文章