思路
比较长的一道阅读题,大致题意为:
一个程序,它给每个物品评分,然后设置一个参数 θ \theta θ ,若评分大于等于 θ \theta θ ,则程序判定结果为阳性,否则判定结果为阴性。
这样的程序会有误判, F P FP FP 代表把原本为阴性的物品,错判为阳性的次数。 T P TP TP 为正确判断阳性的次数。 F N FN FN 与 T N TN TN 的定义类似。
再定义正确率 T P R = T P T P + F N TPR=\frac{TP}{TP+FN} TPR=TP+FNTP,错误率 F P R = F P T N + F P FPR=\frac{FP}{TN+FP} FPR=TN+FPFP.
显然不同的 θ \theta θ 取值会得到不同的 T P R TPR TPR 和 F P R FPR FPR 。
θ \theta θ 取遍所有的值之后,可以得到一组 T P R TPR TPR 和 F P R FPR FPR 。以 T P R TPR TPR 为 y y y 坐标, F P R FPR FPR 为 x x x 坐标,那么就是一组二维平面上的离散点。
这些点可以构建一个函数,(具体构建方法可以根据题目最后一张图来感受感受)求这个函数在 [ 0 , 1 ] [0,1] [0,1] 区间上的积分。
答案就是若干个长方形之和,模拟就可以了。
但是数值的范围为 1 0 9 10^9 109 ,不能枚举值。需要先排个序,枚举下标。
下面代码中,具体做法为,先将 θ \theta θ 取到无穷大,然后不断缩小 θ \theta θ。
c m p cmp cmp 函数是按值从小到大排序。若值相同,将 ‘ + + +’ 排在 ‘ − - −’ 之前,这样得到的一组坐标,它的横坐标和纵坐标都是递增的(非严格递增),就可以计算了。
#include<bits/stdc++.h>
using namespace std;
const int N=1e6+10;
struct V{ char op; int v; }a[N];
int n,tn,fn,tp,fp;
double ans,preX;
bool cmp(V &a,V &b){
if(a.v==b.v) return a.op<b.op;
return a.v<b.v;
}
int main(){
ios::sync_with_stdio(false);
cin>>n;
for(int i=1;i<=n;i++){
cin>>a[i].op>>a[i].v;
if(a[i].op=='+') fn++;
else tn++;
}
sort(a+1,a+n+1,cmp);
for(int i=n;i>=1;i--){
if(a[i].op=='+') tp++,fn--;
else fp++,tn--;
ans+=1.0*tp/(tp+fn)*(1.0*fp/(tn+fp)-preX);
preX=1.0*fp/(tn+fp);
}
cout<<setprecision(10)<<fixed<<ans<<"\n";
}