预测模型结果校准——Bining
- 文献[2]中,将训练集中样本按估计值降序排序,均分成k等分;对于落在某个bin里的新样本,属于某个class的概率等于这个bin中这个class的实例所占的比例。[1]
- 文献[3]中,
(1) 将logistic regression模型的输出结果划分成n个等长的bin,使得
,定义了第i个bin的区间范围。对于第i个bin的校准值通过下式获得:
即计算落在区间
(1) 将logistic regression模型的输出结果划分成n个等长的bin,使得
,定义了第i个bin的区间范围。对于第i个bin的校准值通过下式获得:
即计算落在区间