参考文献:
http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/
https://blog.csdn.net/sinat_36246371/article/details/60140664
朴素贝叶斯分类器:
(x1,x2,…,xn)=(气压,湿度,温度,…)
(y1,y2)=(晴,雨)
假设通过气压,湿度,温度,的情况去推测天气是否下雨,
上述问题可以表示为:
已知X(气压,湿度,温度,…)时天气为Y(晴,雨)的概率。
这个问题实际上就是一个条件概率
由条件概率公式可得,P(Y|X)=P(X,Y)/P(X)
根据贝叶斯定律:P(Y|X)=P(X|Y)P(Y)/P(X)
取P(Y|X)最大时的Y值为预测的情况,同时由于P(x)对所有类别相同,上面的公式可以改写为:
Yi=argmax P(Y|X)=argmax P(Y)P(X|Y)
分别计算P(Y)、P(X|Y)可以推断出Y
P(Y)即先验概率,统计数据集中Y的分布情况,P(y=晴)=(晴的天数)/(总的天数)
P(X|Y)为条件概率,
如X为离散变量:P(x=出太阳|y=晴)=(晴的时候出太阳的天数)/(晴的总天数)
如X为连续变量: