1、从案例出发
假如某个班级有男生80人,女生20人,共计100人。目标是找出所有女生。
现在某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了。评估(evaluation)下他的工作。
(1)accuracy(准确率):0-1损失。分类器(某人)正确分类的样本数/总样本数,即20+50/100=70%
不适合不均衡数据集。举例,总人数100人,男生1人,女生99人,现调出男生。假设都是女生,那么accuracy:99/100=99%
虽然accuracy很高。但是我的目的是要调出男生,它没有做到。差评。
(2)precision(精确率):成功查询到的样本/总查询的样本
前面案例中分别是20/20+30=40% 0/100=0%
(3)recall(召回率):成功查询到的