贝叶斯理论
贝叶斯理论公式:
P ( Y ∣ X ) = P ( X ∣ Y ) P ( Y ) P ( X ) P(Y|X)=\frac {P(X|Y)P(Y)}{P(X)} P(Y∣X)=P(X)P(X∣Y)P(Y)
各项含义用一个简单的例子来说明,比如我们研究天气对某人是否打球的规律:
序号 | 天气 | 打球 |
---|---|---|
1 | 晴 | 否 |
2 | 晴 | 否 |
3 | 阴 | 是 |
4 | 雨 | 是 |
5 | 晴 | 是 |
6 | 雨 | 否 |
7 | 阴 | 是 |
8 | 晴 | ? |
- P ( Y ∣ X ) P(Y|X) P(Y∣X)是给定一个X,是否打球的概率
如第8条记录,晴天时打球的概率是多少呢?这个概率是需要推测的,所以又称为Y的后验概率。 - P ( X ∣ Y ) P(X|Y) P(X∣Y)是打球或不打球时各种天气的概率
比如,打球的情况下,晴天的概率是多少呢? 1 4 \frac 14 41,因为4条标签为打球的记录中只有一条是晴。 - P ( Y ) P(Y) P(Y)就是数据中{打球=是,打球=否}的概率:
这个概率是通过数据就能直接算出来的,所以又称为Y的先验概率。
P ( Y ) = { 4 7 , 3 7 } P(Y)=\{\frac 4 7,\frac 3 7\} P(Y)={ 74,73}
或者 P ( 打 球 = 是 ) = 4 7 P(打球=是)=\frac 4 7 P(打球=是)=74, P ( 打 球 = 否 ) = 3 7 P(打球=否)=\frac 3 7 P(打球=否)=73 - P ( X ) P(X) P(X)是数据中各种天气的概率
比如 P ( 天 气 = 晴 ) = 3 7 P(天气=晴)=\frac 3 7 P(天气=晴)=73
预测
对于一个给定的X,比如第8条记录----晴,预测是否打球。
打 球 = 是 打球=是 打球=是和 打 球 = 否 打球=否 打球=否在X条件下的概率谁大,就选谁,即比较 P ( 打 球 = 是 ∣ X ) P(打球=是|X) P(打球=