skmultiflow.evaluation.EvaluatePrequential

skmultiflow.evaluation.EvaluatePrequential

class(n_wait = 200,max_samples = 100000,batch_size =1,pretrain_size = 200,max_time = inf,metrics = None, output_file =None, show_plot=False,restart_stream =True,data_points_for_classification=False)

前置评估法或交叉测试训练法

参数解释
metrics列表,可选的(默认值:[‘accuracy’,‘kappa’]) 在评估时要计算的指标。也定义了在图中或者需要输出到文件的指标。可选的指标如下

要了解指标含义,首先引入一些概念。

样本

我们需要在一堆西瓜(好瓜和坏瓜堆积在一起)里边找出好瓜。

正样本:即属于某一类(一般是要求的那一类)的样本。(好瓜)
负样本:不属于这一类的样本。(坏瓜)

识别结果

矩阵实际正例实际负例
识别正例True PositiveFalse Positive
识别负例Fase NegativeTrue Negative

TP:被识别为正类,实际也是正样本(正确识别)
挑出好瓜,实际也是好瓜
FP: 被识别为正类,实际是负样本(一类错误识别)
挑出好瓜,实际是坏瓜
FN:未被识别为正类,实际是正样本(二类错误识别)
实际是好瓜,被当成坏瓜没被挑出来
TN:未被识别为正类,实际也是负样本(正确识别)
实际就是坏瓜,正好也没挑出来。

PN 可以被理解为这个瓜被识别成是好的还是坏的,好的就是P,坏的就是N。
TF 可以被理解为这个瓜被人为判定时的准确性,不管他是不是好瓜还是坏瓜,判定准确了就是T,判定错了就是F。

混淆矩阵

上述TP\FP的矩阵为二分类混淆矩阵。
一般的

confusion matrix预测值
类别1类别2类别3
真实值类别1abc
类别2def
类别3ghi
一致性:模型预测结果和实际分类结果是否一致

Po为预测的精度,也可以理解为预测的一致性
P o = a + e + i a + b + c + d + e + f + g + h + i P_o = \dfrac{a+e+i}{a+b+c+d+e+f+g+h+i} Po=a+b+c+d+e+f+g+h+ia+e+i
Pe表示偶然一致性
假设每类的真实样本个数是a1,a2,……,ac,而预测出来的每类样本个数分别是b1,b2,……,bc
总样本个数为n,则有 p e = a 1 × b 1 + a 2 × b 2 + ⋯ + a c × b c n × n p_e = \dfrac{a1\times b1+a2\times b2 + \dots + ac \times bc }{n \times n} pe=n×na1×b1+a2×b2++ac×bc

准确率

分类正确的样本数与样本总数之比。即 a c c r u a c y = T P + T N T P + F P + F N + T N accruacy = \dfrac{TP + TN}{TP+FP+FN+TN} accruacy=TP+FP+FN+TNTP+TN

精确率

以预测结果为判断依据。被预测识别为正类的实例中,实际正样本占预测样本的比例。即 p r e c i s i o n = T P T P + F P precision = \dfrac{TP}{TP+FP} precision=TP+FPTP

召回率

以实际样本为判断依据,实际为正例的样本中,被判断为正例的正样本(正确判定为正样本)占总实际正样本的比例。
r e c a l l = T P T P + F N recall = \dfrac{TP}{TP+FN} recall=TP+FNTP

F1值

比如总共有10个瓜,里边有5个好瓜,我们只识别出来里边有一个好瓜,正好还对了,那么精确率是1, 但是召回率是1/5。或者说,我们这10个瓜都识别成好瓜了,那么召回率为1,但是精确率只有1/2。
所以说单独用精确率和召回率很难评估模型的好坏。 F1就中和了这两个指标。
F 1 = 2 P R P + R F1 = \dfrac{2PR}{P+R} F1=P+R2PR P代表精确率,R代表召回率

好了,回归正传。 skmultiflow.evaluation.EvaluatePrequential的评估指标 包含以下几个部分。
在分类时

分类解释
accuracy准确率:分类正确的样本数与样本总数之比。即 a c c r u a c y = T P + T N T P + F P + F N + T N accruacy = \dfrac{TP + TN}{TP+FP+FN+TN} accruacy=TP+FP+FN+TNTP+TN
kappakappa系数,度量一致性的指标,值在[-1,1]。 K = P o − P e 1 − P e K = \dfrac{P_o-P_e}{1-P_e} K=1PePoPe
precision精确率:被分为正类的实例中实际正样本的比例。即 p r e c i s i o n = T P T P + F P precision = \dfrac{TP}{TP+FP} precision=TP+FPTP
recall召回率:实际为正例的样本中,被判断为正例的正样本(正确判定为正样本)占总实际正样本的比例 r e c a l l = T P T P + F N recall = \dfrac{TP}{TP+FN} recall=TP+FNTP
f1F1值, F 1 = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l F1 = \dfrac{2\times Precision \times Recall}{Precision+Recall} F1=Precision+Recall2×Precision×Recall

kappa值含义:

含义
-1完全不一致
0偶然一致
0.0~0.2极低的一致
0.21~0.4一般的一致
0.41~0.60中等的一致
0.61~0.80高度的一致
0.81~1几乎完全一致
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值