在binary classification model中,ROC或AUC作为一种常用的技术,有两个优点:不随真实情况的事件改变、不随分类错误的相对成本改变,因此当future incidents、relative cost of classification errors或两者都不稳定或未知时,ROC是很好的选择。
AUC的值在0.5-1之间,0.5表示完全不确定,分类随机,一般0.65-0.85之间表示模型较好。
建立binary classification model后,我们的目的是vary parameters to maximize ROC on a sample set with known outcome,这个set叫做training set。
一个计算ROC曲线面积的例子:
共有7个事件&#