一、Multi-Class Multi-Label问题定义
所谓多分类(Multi-Class)是区别于二分类的一个概念,在二分类问题当中,数据的标签只是0,1二值类型,比如“是否”是一只狗,“是否”患病。而多分类则对应于更多的类别,比如判断物体是猫,狗,鸟,兔......判断病人患的是A,B,C,D中的某一种病。值得注意的是,多分类问题中常常只有一个类别是正确的。
什么是多标签(Multi-Label)呢?简单来说,就是一个样本同时具有多个标签,例如一张风景图,里面有天空、猫、狗、鸟、树,如果这些类别都属于当前任务所需要识别的类别之内,那么它就具有多个标签。显然,多标签任务的难度要高的多。
二、评估方式
参考[1] [2],多分类多标签模型的评估指标通常分为两大类: example-based metrics, label-based metrics。
Example-based Metrics
1.Subset accuracy
其中
指代一个多标签分类器
,
返回预测的标签集合,
为样本个数。
# gt为真实标签,predict为预测标签
# 形式例如:gt=[[1,0,0,1]], predict=[[1,0,1,1]]
def example_subset_accuracy(gt, predict):
ex_equal = np.all(np.equal(gt, predict), axis=1).astype("float32")
return np.mean(ex_equal)
2.Example accuracy
def example_accuracy(gt, predict):
ex_and = np.sum(np.logical_and(gt, predict), axis=1).astype("float32")
ex_or = np.sum(np.logical_or(gt, predict), axis=1).astype("float32")
return np.mean(ex_and / (ex_or+epsilon))
3.Example precisi