今天我们学习的是高斯朴素贝叶斯算法。
- 学习前一句话概括心中的高斯朴素贝叶斯模型:
直接对已经有的数据进行估计,估计它的分布,得到一系列的先验概率。
而后将新的数据带入贝叶斯公式利用不同类型发生情况的概率(先验概率)和观测值算出一系列概率,最后取其中最大的一个作为最终的概率。
课后修正:存在的问题有没有解释高斯,高斯实际上就是数据是服从高斯分布的,朴素贝叶斯和贝叶斯算法不同,朴素贝叶斯针对高维数据的计算做出简化,假设高维数据各个特征并不相关,那么计算后验概率的时候可以把乘法改成用加法。
- 帮助分辨什么是贝叶斯公式
定义:
正向概率:知道数据分布寻求结果
逆向概率:知道结果估计数据分布
例子:
在一个房间中,穿红色衣服的人一定是病人,工作人员中有一半的人穿红色衣服一半穿白色衣服
正向概率:随机挑选一个人,问他穿着红色衣服的概率。(问某个条件发生的概率应用公式:古典概率的公式)
逆向概率:已知有一个人穿着红色衣服,那么他是工作人员的概率是多少?(应用公式P(A|B) = P(AB)/P(B) 或 P(A|B) = P(B|A)/P(A))
贝叶斯算法解决问题二:
1、计算已有数据的分布得到各种可能的先验概率:
2、通过先验概率和新得到的数据计算各个可能的后验概率:
3、比较各个后验概率取最大的一个:
(等待补充)