第六章主要讲解了贝叶斯公式,讲的比较易懂,也没有写复杂的公式。
在这章我们不幸得了蜥蜴流感,医院初次诊断结果为阳性。
我们查到该诊断实验 如若患病有90%概率为阳性,如若未患病10%概率为阳性。(这里不会介绍各个分类模型,以后有机会可能会介绍)。
我们这里假设2种情形:
1.100人中90人患病:
这表示有10人不患病,10人的10%等于1,这1人诊断结果为阳性且未患病。
2.100人中10人患病:
这表示有90人不患病,90人中10%约等于9,这9人诊断结果为阳性且未患病。
我们可以用饼状图来表示一下这两种假设的情形。
import matplotlib.pyplot as plt
X = [81, 9, 1, 9]
Y = [9, 9, 9, 81]
labels = ['TP', 'FN', 'FP', 'TN']
plt.figure(1)
plt.pie(X, labels=labels, autopct='%1.2f%%')
plt.figure(2)
plt.pie(Y, labels=labels, autopct='%1.2f%%')
plt.show()
我们这里要看的是FP的概率(诊断结果为阳性,实际结果为阴性)的概率。
前者为1%,后者为8.33%,由此可见,整体的患病率影响着我们诊断结果的正确率。
(书中对真阴性的描述有误,真阴性应为TN(真负例),而书中描述为,FN(假负例))(原书175页)
我们这里计算的为条件概率,