[Statistics] 科研中常见的统计学指标

统计学指标

Cohen’s Kappa coefficient

用途:Cohen’s Kappa coefficient用于度量两个rators对于同一事物二分类的一致性程度。

科研中,有些二分类任务的结果需要human evaluation作为groundtruth。这时候,两个author会对实验结果进行采样并判断是否分类正确,Cohen’s Kappa coefficient越高,代表他们对于结果一致认可的程度越高。

Cohen’s kappa coefficient计算公式

k = ( p 0 − p e ) / ( 1 − p e ) k = (p_0 - p_e) / (1 - p_e) k=(p0pe)/(1pe)

其中:

  • p 0 p_0 p0 relative observed agreement among rators。
    p 0 p_0 p0 是所有打分中,两个rator打分一致的频次

  • p e p_e pe hypothetical probability of chance agreement
    p e p_e pe 是根据观察,两个rator打分一致的概率

举个例子来说明:

博物馆有100个待展览的展品,两个管理员独立对它们进行分类,yes代表展出,no代表不展出。

他们的打分结果如下

rator1\rator2YESNo
Yes3020
No1535

计算过程如下:

  • p 0 = ( 30 + 35 ) / 100 = 0.65 p_0 = (30 + 35) / 100 = 0.65 p0=(30+35)/100=0.65 (意见一致的频率)
  • p e = 0.5 ∗ 0.45 + 0.5 ∗ 0.55 = 0.5 p_e = 0.5 * 0.45 + 0.5 * 0.55 = 0.5 pe=0.50.45+0.50.55=0.5 (根据观察,同时打yes或者同时打no的概率)

最终的Cohen’s Kappa coefficient得分为
( 0.65 − 0.5 ) / ( 1 − 0.5 ) = 0.3 (0.65 - 0.5) / (1 - 0.5) = 0.3 (0.650.5)/(10.5)=0.3

Cohen’s Kappa coefficient的参考分数

scoreinterpretation
≤ 0 \le 0 0no agreement
( 0 , 0.20 ] (0,0.20] (0,0.20]none to slight
( 0.21 , 0.40 ] (0.21,0.40] (0.21,0.40]fair
( 0.41 , 0.60 ] (0.41,0.60] (0.41,0.60]moderate
( 0.61 , 0.80 ] (0.61,0.80] (0.61,0.80]substantial
( 0.81 , 1.00 ] (0.81,1.00] (0.81,1.00]perfect agreement
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: "Naked Statistics:赤裸裸的统计学" 是由著名统计学家Charles Wheelan所著的一本有趣、易懂、生动的统计学入门读物,读者不需要非常高深的数学知识,但可以深刻理解统计学的精髓和应用。本书主要涵盖了统计学的基本概念、统计推断、回归分析、统计学在商业和政策制定的应用等方面的内容。 本书不仅仅是为了向读者传递统计学的技能和方法,更重要的是想要让读者理解和欣赏数据并从获取有用的信息。除此之外,书还提出了一些重要但常常被忽视的问题,例如:样本大小、误差范围、信心水平等。这些都是重要的因素,决定了我们对数据的理解和使用。 "Naked Statistics"对于希望进入统计学领域的读者们来说是非常有价值的一本书。在阅读过程,我们可以通过作者生动幽默的语言和实际应用示例,深入理解数据、概率和统计学的基础知识,并了解统计学在商业、医疗保健、政策制定等领域的应用。 同时,本书还提供了在线学习视频、练习题和其他免费工具,帮助读者更好地理解和掌握统计学。总的来说,Charles Wheelan的"Naked Statistics"是一本可读性极强、内容丰富、应用范围广泛的统计学入门读物,非常适合初学者和非数学专业的人士阅读。 ### 回答2: 《赤裸裸的统计学》是一本由统计学家查尔斯·韦尔纳斯撰写的畅销书籍,旨在向读者介绍统计学的基本概念和原则,并且帮助人们更好地理解和运用数据。这本书语言通俗易懂,没有过多的公式和数学符号,使得读者能够轻松理解和应用其内容。 书籍的主要内容包括统计学的概念、数据的收集和分析方法、数据可视化、抽样调研、假设检验等。本书通过丰富的案例和实例,让读者领会到统计学在现实生活和实践的重要性,并且通过这些案例和实例,展现了数据在各个领域的广泛应用。 最后,这本书还提供了一些在数据分析常用的工具和软件,如R语言、Excel和SPSS等。这些工具可以帮助读者更加高效地收集、处理和分析数据信息。 总之,《赤裸裸的统计学》是一本非常实用和普及化的统计学指南,对于任何关心数据和统计学的读者来说都是一本不可多得的好书。同时,本书的PDF版本在微盘也提供下载,方便广大读者获取。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值