【读书笔记】只有浅出没有深入的数据分析(六)

本文通过实例解析了贝叶斯公式,探讨了蜥蜴流感的诊断情况,展示了患病率如何影响诊断结果的正确率。文章指出,基础概率(事前概率)在分析中的重要性,并用TP、FN、FP、TN的概念解释了分类结果。在新的条件下,通过二次诊断,计算了患病和未患病的概率,强调了贝叶斯公式在整合新信息进行分析时的精确性。
摘要由CSDN通过智能技术生成

第六章主要讲解了贝叶斯公式,讲的比较易懂,也没有写复杂的公式。

在这章我们不幸得了蜥蜴流感,医院初次诊断结果为阳性。

我们查到该诊断实验  如若患病有90%概率为阳性,如若未患病10%概率为阳性。(这里不会介绍各个分类模型,以后有机会可能会介绍)。

我们这里假设2种情形:

1.100人中90人患病:

这表示有10人不患病,10人的10%等于1,这1人诊断结果为阳性且未患病。

2.100人中10人患病:

这表示有90人不患病,90人中10%约等于9,这9人诊断结果为阳性且未患病。

我们可以用饼状图来表示一下这两种假设的情形。

import matplotlib.pyplot as plt

X = [81, 9, 1, 9]
Y = [9, 9, 9, 81]
labels = ['TP', 'FN', 'FP', 'TN']

plt.figure(1)

plt.pie(X, labels=labels, autopct='%1.2f%%')

plt.figure(2)
plt.pie(Y, labels=labels, autopct='%1.2f%%')
plt.show()

我们这里要看的是FP的概率(诊断结果为阳性,实际结果为阴性)的概率。

前者为1%,后者为8.33%,由此可见,整体的患病率影响着我们诊断结果的正确率。

(书中对真阴性的描述有误,真阴性应为TN(真负例),而书中描述为,FN(假负例))(原书175页)

 

我们这里计算的为条件概率,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值