公式:
P(H):先验概率 the probablity hypothesis is true (before the evidence)
P(E/H): probablity of seeing the evidence if the hypothesis is true
P(E): the probablity of seeing the evidence
下面举个栗子来理解公式:
有个人叫做steve ,严谨又害羞(a meek and tidy soul)
你觉得哪种可能性更大,他是图书馆管理员还是农民?
绝大部人听了steve性格描述后都认为steve是个图书馆管理员,然而这种思考是不理智的,因为人们没有考虑图书馆管理员和农民的比例。
现在我们假设图书馆管理员:农民 = 1: 20
我们可以画个图书馆员和农民的样图(10个图书馆管理员和200个农民)
当我们听到人物性格描述是:严谨又害羞
我们假定你的直觉是“40%的图书管理员,严谨又害羞 ”,“10%的农民严谨又害羞”
因此4个图书馆管理员,20个农民
从“严谨又害羞”这个描述中随机抽取一人,他是图书馆管理员的概率是4/24
从“严谨又害羞”这个描述中随机抽取一人,他是农民的概率是20/24
因此,即使我们认为图书管理员中性格 ‘’严谨又害羞‘’ 的人占比40%, 农民中性格 ‘’严谨又害羞‘’ 的人占比10%,这个人是农民的概率还是比是图书馆管理员大。
贝叶斯定理最根本的
结论也就是说:新论证不能凭空决定你的看法 ,而是因该更新先验看法
贝叶斯定理的精髓是:见到所有的证据限制了概率空间之后再考虑比例
when to use bayes' rule ?
1. You have a hypothesis : Steve is a librian 你有一个假设
2. you see some evidence: a meek and tidy soul 你有一些证据
3. you want to know the probability that your hypothesis holds given that the evidence is true (你想知道在‘你得到的证据是真的’的条件下‘你的假设成立’的概率)
在我们上面的栗子中
1.hypothesis(这个meek tidy soul 是图书管理员):P(H)=1/21(先验概率,在考虑新证据前,图书管理员占总人数的比率)
2.之后我们要考虑图书管理员中符合这个描述的比例
P(E/H)=0.4 (在假设成立的情况下,我们看到证据的概率) when you see this vertical bar, it means we are talking about some proportion of a limited part of total space of posibilities,
在这个例子里,我们的E 是10*0.4=4人,这个E也被称作likelihood。
类似的,如果我们要知道概率空间的另一侧包含多少证据,即在假设不成立的情况下,我们看到证据的概率。P(E/非H)=0.1
3.在证据为真的条件下,这个人是图书管理员假设成立的可能性,
也就是所有符合证据的图书馆管理人数4 除以所有符合证据的人数24
通常我们这样写bayes公式
P(E) the total probablity of seeing the evidence, in our case is 24/210
在练习中还是要拆分成假设成立和假设不成立:1/21*210*0.4+20/21*210*0.1
最后算出来的结果叫做后验概率