Kappa系数和Fleiss Kappa系数是检验实验标注结果数据一致性比较重要的两个参数,其中Kappa系数一般用于两份标注结果之间的比较,Fleiss Kappa则可以用于多份标注结果的一致性检测,我在百度上面基本上没有找到关于Fleiss Kappa系数的介绍,于是自己参照维基百科写了一个模板出来,参考的网址在这里:维基百科-Kappa系数
这里简单介绍一下Fleiss Kappa系数的计算过程,假设有以下数据:
以上是14个人对于10个任务进行的5级标注的结果(N = 10,n = 14, k = 5),以上计算Fleiss Kappa系数的过程如下:
①对于Pj的计算,为每一列结果相乘除以任务总数,这里任务总数为14*10=140,对应于Kappa系数中每个分类的随机一致概率,然后由于Fleiss Kappa没有一个参照的标注值,因此这里计算Pe理论一致性的时候,将每个Pj